Slide 6
Slide 6 text
クラウド環境|Google Compute Engine
• 使っているインスタンスはだいたい2つ
• vCPU × 4, 30GB memory, NVIDIA Tesla T4 × 1, ondemand
• vCPU × 4, 30GB memory, NVIDIA Tesla V100 × 1, preemptible
• preemptible が落ちたことは GCE の機能を使って LINE に通知を飛ばして知る
• GCE のインスタンスグループを作ると自動で再立ち上げが可能
• 環境構築:Deep Learning VM + pip
• Pipenv→Dockerと1周まわってこれが結構楽な気がしている
• ローカルとのソースコード同期:PyCharm の automatic upload
• 1つしかインスタンスを立てない時はいいが、複数立てるときが面倒
• 軽いインスタンスを立ててソースコードを同期しておき、
それを複数のインスタンスにマウント(sshfs)すればよい
• AI Platform Training を使えばいろいろな苦痛が軽減されるかも
• データのVM間共有:Google Cloud Storage
• 学習用と可視化用でインスタンスを分けたいときに便利
• Tensorboard のログも GCS に入れておくと便利
6