比較実験にAlexNetを用いようと思ったのですが、AlexNetとは何なのか分からなくなりました。
構造はググれば出てくるわけだけど、パラメータはImageNetのものです。ImageNetは大きなデータセットですから入力も(227,227,3)になります。
ですが、僕が使っているデータセットはFashion-MNISTなので入力は(28,28,1)です。これ用にAlexNetのパラメータをいじるとそれはAlexNetなのか、はたまたAlexNetだったものになるのか。
解決策としてFashion-MNISTの画像を拡大して入力を(227,227,1)にしようと思いついて、実装してみたのですが(実装でハマって3時間無駄にした)、今度はコアダンプになって詰みました。AlexNetの論文でも「データがGPUのメモリに乗り切らないためGPU2つに分けて実装している」的なことが書かれているので原因はそれかなあと。
俺の3時間が…。