Slide 28
Slide 28 text
行列乗算のみGPU化
pure GPU化
もろもろのGPU化や
特定計算用の特化コー
ド用意など
レイヤー融合や
メモリ転送最適化など golf, メモリ最適化
タイリング最適化など
いろいろ
googlenet
top1:68.7%, top5:88.9%
mobilenet v1
top1:70.9%, top5:88.9%
mobilenet v2
top1:71.8%, top5:91.0%
depthwise, pointwise改善
メモリ管理改善などいろいろ
※ラズパイの GPU周波数に対する誤解があり、
ここ以前はオーバークロック状態 (400MHz)で測っているケースがありました。
ここ以後はデフォルト周波数 (300MHz)での値です。