進捗どうでしょう

主な話題は 社会人生活/情報工学/アニメ/ライトノベル/漫画/映画/自炊 などです。

MENU

何がAlexNetなのか

 比較実験にAlexNetを用いようと思ったのですが、AlexNetとは何なのか分からなくなりました。

 構造はググれば出てくるわけだけど、パラメータはImageNetのものです。ImageNetは大きなデータセットですから入力も(227,227,3)になります。

 ですが、僕が使っているデータセットはFashion-MNISTなので入力は(28,28,1)です。これ用にAlexNetのパラメータをいじるとそれはAlexNetなのか、はたまたAlexNetだったものになるのか。

 解決策としてFashion-MNISTの画像を拡大して入力を(227,227,1)にしようと思いついて、実装してみたのですが(実装でハマって3時間無駄にした)、今度はコアダンプになって詰みました。AlexNetの論文でも「データがGPUのメモリに乗り切らないためGPU2つに分けて実装している」的なことが書かれているので原因はそれかなあと。

 俺の3時間が…。