手持ちのサーバの構成を考え、Deep learningの環境テストを行うノードをPRIMERGY RX200S6に移した。
手順は
- クラスタから切り離す。
- 一般ユーザを作成。
- グラボを移し替え。
- NVIDIAのドライバインストール。
- CUDAのインストール。
- pyenvインストール。
- anacondaインストール。
- pythonのバージョンを3.6に落とす。
- tensorflow-gpuインストール。
- kerasインストール。
以上。
以前やったとおりで特に問題なく構築完了。
CPUが1世代前になって、理論速度では96GFLOPSから80GFLOPSに落ちたが、mnist_cnn.pyのテストで1EPOCHあたりにかかった時間は76秒と全く同じ。CPUの速度はほぼ関係ないということだろう。ということでRX300S7の方をクラスタに組み込むことにする。
EPOCH=1のトータルタイムは
GPUあり85.33秒
GPUなし138.65秒
sandy bridgeの96GFLOPSマシンで108秒だったのが80GFLOPSになったのでGPUなしは確実に遅くなったが、GPUありだとほとんど一緒だな。