まんぼう日記

takataka's diary

MNISTのデータを読み込むPythonプログラム

12月1月2月の忙しシーズン真っ最中ですが,ちょっとだけ余裕ができました.というわけで今日はゆっくり…台所片付けたり,洗濯したり,カレー作ったり.食器とかあふれて悲惨なことんなってた台所片付けて洗い物してたら,ガラス容器を割ってまいました.食洗機の扉が閉まらへんから力かけたらパリン…入れ方悪くて他の食器とおしくらまんじゅうんなってたみたい….気を取り直して,いろんな残骸とかあふれて悲惨なことんなってたダイニングテーブルの上を片付けてたら,また….端っこに置いてたコーヒーポットが振動で落っこちてパリン… (;_;)

 

ちゅーわけで片付けから逃避してプログラミング (^^;

 

 「かたつう」と Theano のお勉強 - 7時間目 - まんぼう日記 のつづきやりたいけどさすがにそこまでの余裕はないので,

MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges

のデータを読み込む Python プログラムを書きました.Pylearn2 のお勉強 - 6時間目 - まんぼう日記 では Pylearn2 を使って読み込んでるけど,Pylearn2 に頼らず自前でバイナリデータを読み込むようにしてみたってわけです.

 

…そんだけです.Pylearn2 とか Theano とかの話の続きを期待してたみなさんごめんなさい.pylearn2 のんみたいにイテレータとか使ってなくて,データ全部丸ごと読み込む仕様です.ださださ.

 

試しに学習データの最初の100枚を可視化してみるとこんなんでした.

 

f:id:takatakamanbou:20150117221123p:plain