Upgrade to Pro — share decks privately, control downloads, hide ads and more …

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

mogamin
June 07, 2019

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

mogamin

June 07, 2019
Tweet

More Decks by mogamin

Other Decks in Technology

Transcript

  1. WHO AM I? Takashi, MOGAMI / @mogamin ウルシステムズ株式会社 シニアコンサルタント 画像処理(OpenCV)、DeepLearningや強化学習がメインの業務。時間があ

    ればkaggleやSIGNATEで技術を磨いたり、社内ではScrum浸透活動や arxiv論文を読む活動したり。最近ではgraphを使った研究開発を推進中。 - Scrum Master - AWS Certified Solutions Architect Professional ※本内容は個人の見解です。所属組織とは一切関係ありません。
  2. Outline - EfficientNet (Mingxing Tan, Quoc V. Le, Google AI)

    - Abstract/概要 - 1. Introduction/導入 - 2. Related Work/関連研究 - 3. Compound Model Scaling/複合モデルのスケール - 4. EfficientNet Architecture/提案するEfficientNetアーキテクチャ - 5. Experiments/実験 - 6. Discussion/議論 - 7. Conclusion/まとめ
  3. Abstruct - CNNは一般的に予算の中で限度のあるリソースを使って開発されます。もちろん リソースを増やせば精度は高くなるでしょう。 - 我々は、すべての次元(深さ、広さ、解像度)を、単純だけど、効率的な複合係 数を統一的に使用することによって、スケーリングさせる手法を提案します。さ らに、MobileNetsとResNetをスケールアップさせる方法についても示します。 - さらに

    EfficeineNetsという新しいベースラインを用いてスケールするニューラル アーキテクチャを開発しました。これは以前のConvNetよりも高い精度を得るこ とができます。EfficenetNet-B7はS.O.T.A.です。そのモデルサイズは従来よりも小 さく、推論スピードも早いです。転移学習についても同様です。 https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet
  4. 1. Introduction(2/5) - 我々は、「よりよい制度と効率を達成することができる原則的な方法があるの か」という問題について調査します。 - 我々の実証的研究において、ネットワークの全次元(depth, width, reslution)のバ ランスをとることが重要であることがわかりました。そして驚くことに、そのバ

    ランスは単純にそれらを一定の比率で拡大縮小させるだけで達成することが出来 ます。その結果を経て、単純だけと効果的な複合的なスケールの手法を提案しま す。 - 例えば、2倍もの計算ソースを使いたい場合、単純にネットワークのdepthをα, widthをβ, image-sizeをγだけ増やせばいいのです。α、β、γは元のモデルに対す るGridSearchで決定される係数です。
  5. 2. Related Work - ConvNet Accuracy - AlexNet- > GooglNet(6.8M)

    -> SENet(145M) -> GPipe(557M parameters) - 高い精度はアプリケーションにとって重要なんだが、メモリ等のハードウエアの制約がある。 さらなる精度向上には、もっと効率的にする必要があるじゃん。 - ConvNet Efficiency - DeepConvNetはパラメータサイズが大きくなりすぎです。モデル圧縮は普通の方法ですが、 モデルの効率化と精度はトレードオフの関係にあります。モバイル端末はどこにでもあるよ うになるのです。SqueezeNets,MobileNets,ShuffleNetsのように効率的にモデルサイズを圧縮す ることが一般的になっております。しかしながら、その方法は確立されていません。目的を 達成するために、我々はmodel scalingに頼ります。 - Model Scaling - ...
  6. 3. Compound Model Scaling - 3.1. Problem Formulation - 3.2.

    Scaling Dimensions - depth/width/resoution - 3.3. Compound Scaling - α、β、γは、small-grid-searchによって 決められる定数です。 - Φはモデルをスケールさせるために使 えるリソースを制御するためのユーザ が指定する係数です。 s.t.(such that) ~であるような ※GridSearch:ハイパーパラメータを自動的に探索する手法