AI論文読み会10月:Arxivまとめ

Slide 1

Slide 1 text

AI 最新技術 Update 会 10 ⽉⼤阪市⽴⼤学医学部附属病院中央放射線部⽚⼭豊 2020/10/07

Slide 5

Slide 5 text

① ディープニューラルネットワークにおける個々のユニットの役割の理解 (原⽂: Understanding the Role of Individual Units in a Deep Neural Network) • ディープニューラルネットワークは，⼤規模なデータセットで複雑なタスクを解決する階層的な表現を⾒つけることを得意としている． • ⼈間はどのようにしてこれらの学習された表現を理解することができるのだろうか？ • 本研究では，画像分類や画像⽣成ネットワーク内の個々の隠れたユニットの意味を体系的に特定するための解析フレームワークであるネットワーク解剖を提⽰する． 1. シーン分類で訓練された畳み込みニューラルネットワークを解析し，多様なオブジェクト概念にマッチするユニットを発⾒する． • シーンクラスの分類に重要な役割を果たす多くのオブジェクトクラスをネットワークが学習しているという証拠が得られる． 2. シーンを⽣成するために訓練された Generative adversarial network (GAN) を同様の解析⼿法を⽤いて解析する． • ⼩さなユニットのセットが活性化または⾮活性化されたときに⾏われた変化を分析することより，オブジェクトが⽂脈に適応しながら，出⼒シーンから追加・削除されることを発⾒した． 3. 解析フレームワークを，敵対的攻撃の理解とセマンティック画像編集に適⽤する． http://arxiv.org/abs/2009.05041v2 DNN の個々のユニットを統計的に分析することで明⽰的に “⽊” などの概念を与えなくてもそれらを学習しているユニットの存在を発⾒ GAN では各々の概念を司るユニットを操作することで⽣成画像を変化させることに成功気になった論⽂

Slide 11

Slide 11 text

④ ディープニューラルネットワークを⽤いた継続学習の全体像．忘れられた教訓とアクティブでオープンワールドの学習への橋渡し (原⽂: A Wholistic View of Continual Learning with Deep Neural Networks: Forgotten Lessons and the Bridge to Active and Open World Learning) • 我々の結果は，これが個々のパラダイムに利益をもたらすだけでなく，共通のフレームワークにおける⾃然な相乗効果を強調していることを⽰している． • 我々は経験的に，従来提案されていた⼿法が失敗していたところにロバストなオープンワールドアプリケーションを⽰しながら，壊滅的な忘却の緩和，能動学習でのデータクエリ，タスクの順序の選択などの改善を実証している． • 従来提案されていた⼿法では失敗していた堅牢なオープンワールドアプリケーションを⽰しながら，壊滅的な忘却の緩和し，能動学習でのデータクエリ，タスクの順序を選択するときの改善を経験的に⽰す． http://arxiv.org/abs/2009.01797v2 ヨハン・ヴォルフガング・ゲーテ⼤学フランクフルト・アム・マイン (ドイツの公⽴⼤学) の研究継続学習，オープンセット，能動学習 (Active Learning) の包括的レビューこれらを統合する重要性を主張，ベースラインとなる⼿法を提案破滅的忘却 (Catastrophic Forgetting) 機械学習で新たなタスクを学習すると，過去に学習したタスクに対する性能が著しく低下する．継続学習ではその弱点を改善．オープンワールド (Open World) コンピュータゲーム⽤語 (英語) 舞台となる仮想世界を⾃由に動き回って探索・攻略できるように設計されたレベルデザインを指す⾔葉 ex: Minecraft (Microsoft) 3/3

Slide 24

Slide 24 text

⑨ MEAL V2: バニラ ResNet-50 をトリックなしで ImageNet 上で 80% 以上の Top-1 精度にブースト (原⽂: MEAL V2: Boosting Vanilla ResNet-50 to 80%+ Top-1 Accuracy on ImageNet) • Vanilla ResNet-50 の精度を 80% 以上の Top-1 精度に向上可能なシンプルで効果的な⼿法の提案． • 提案⼿法は，最近提案された Multi-Model Ensemble via Adversarial Learning (MEAL)，すなわち判別器を介したアンサンブル知識蒸留に基づいている． • “類似度損失と判別器を最終出⼒のみに採⽤” し，“全教師アンサンブルからのソフトマックス確率の平均値を蒸留のためのより強⼒な監督として⽤いることでさらに単純化” している． • 提案⼿法の重要な観点の⼀つは，蒸留過程でワンホット/ハードラベルを使⽤してはならないということである． • このようなシンプルなフレームワークが既存の⼿法 (アーキテクチャの変更，ImageNet以外の外部学習データ，autoaug/randaug，余弦学習率， mixup/cutmix学習，ラベルスムージングなどの⼀般的な⼿法) を⼀切使⽤することなく，最先端の結果を得ることができることを⽰した． • ImageNet dataset では，Vanilla ResNet-50 で 224×224 の単⼀クロップを⽤いて，80.67% の top-1 精度を達成しており，同じネットワーク構造の下では，従来の⼿法を⼤きく凌駕する結果となった． • この結果は，知識蒸留を⽤いた ResNet-50 の新たな強⼒なベースラインと⾔える． • 我々の知る限りでは，アーキテクチャの変更や追加のトレーニングデータなしに， Vanilla ResNet-50 の ImageNet 上での精度を 80% 以上まで向上できたのは初めてである． http://arxiv.org/abs/2009.08453v1 カーネギー・メロン⼤学 (アメリカ合衆国の私⽴研究⼤学) の研究 MEAL: 蒸留された知識を敵対学習で伝達するアンサンブル法

Slide 33

Slide 33 text

① Relay: ディープラーニングのための⾼レベルコンパイラ (原⽂: Relay: A High-Level Compiler for Deep Learning) • ディープラーニング (DL) モデルを記述，コンパイル，最適化するためのフレームワークは，近年，コンピュータビジョンや⾃然⾔語処理などの分野での進歩を可能にしてきた．しかし，これらのフレームワークを拡張して，急速に多様化する DL モデルやハードウェアプラットフォームに対応するには，表現⼒，コンパイル性，移植性など，トレードオフの難しさがある． • 本稿では，DL⽤の新しいコンパイラフレームワークである Relay を紹介する． • Relay の機能的で静的型付けされた中間表現 (IR) は，既存の DL IR を統合・⼀般化し，最先端のモデルを表現する． • Relay の表現⼒の⾼い IR を導⼊するには，ドメイン固有の最適化を慎重に設計する必要があるが，これは Relay の拡張メカニズムによって対応されている． • これらの拡張メカニズムを利⽤して，Relay は様々なハードウェア・プラットフォームをターゲットとすることができる統⼀されたコンパイラをサポートしている． • 今回の評価では，幅広いクラスのモデルやデバイス (CPU，GPU，新興アクセラレータ) に対して Relay が競争⼒のある性能を発揮することを実証している． • Relay のデザインは，統⼀された IR が性能を犠牲にすることなく，表現⼒，構成性，移植性を提供できることを実証している． http://arxiv.org/abs/1904.08368v2 ワシントン⼤学 (アメリカ合衆国の州⽴⼤学) の研究 Relay と⾔う新しいフレームワークの紹介ハードウェア，ソフトウェアに対する拡張性の⾼い DL コンパイラの中間表現が可能

Slide 45

Slide 45 text

⑤ ディープニューラルネットワークを⽤いた継続学習の全体像。忘れられた教訓とアクティブでオープンな世界の学習への橋渡し (原⽂: A Wholistic View of Continual Learning with Deep Neural Networks: Forgotten Lessons and the Bridge to Active and Open World Learning) • 現在の深層学習研究はベンチマーク評価が主流である。 • ある⼿法は、専⽤のテストセットで経験的に良好な結果が得られれば、その⼿法は好ましいものとみなされる。 • この考え⽅は、ベンチマークデータの連続的なセットが研究されている継続的学習の分野にもシームレスに反映されています。 • 中⼼的な課題は、反復的なパラメータ更新により、以前に取得した表現が壊滅的に忘れ去られないように保護することです。 • しかし、個々の⼿法の⽐較は、現実世界でのアプリケーションとは切り離して扱われ、⼀般的には蓄積されたテストセットの性能を監視することで判断されます。 • クローズドワールドの仮定が依然として優勢です。 • これは、配備の間、モデルが訓練に使⽤されたのと同じ分布に由来するデータに遭遇することが保証されていることを前提としています。 • ニューラルネットワークは未知のインスタンスに対して過信した誤った予測を⾏い、破損したデータに直⾯して故障することがよく知られているため、このことは⼤きな課題となっています。 • 本研究では、オープンセット認識、観測されたデータセットの外で統計的に乖離したデータを識別すること、そして、期待される性能向上が最⼤になるようにデータを増分的に照会するアクティブラーニングの隣接分野からの注⽬すべき教訓が、ディープラーニング時代にはしばしば⾒落とされていることを論じている。 • これらの忘れられた教訓に基づいて、我々はディープニューラルネットワークにおける継続学習、能動学習、オープンセット認識を橋渡しする統合的な視点を提案する。 • 我々の結果は、これが個々のパラダイムに利益をもたらすだけでなく、共通のフレームワークにおける⾃然な相乗効果を強調していることを⽰している。我々は経験的に、従来提案されていた⼿法が失敗していたところにロバストなオープンワールドアプリケーションを⽰しながら、壊滅的な忘却の緩和、アクティブ学習でのデータの問い合わせ、タスクの順序の選択などの改善を実証している。 http://arxiv.org/abs/2009.01797v2 継続学習，オープンセット，能動学習 (Active Learning) の包括的レビューこれらを統合する重要性を主張，ベースラインとなる⼿法を提案 Top recent ④

Slide 50

Slide 50 text

⑨ 地に⾜のついた⾔語学習を速くゆっくりと (原⽂: Grounded Language Learning Fast and Slow) • 最近の研究では，従来の教師あり学習で訓練された⼤規模なテキストベースのニューラル⾔語モデル少数のワンショット学習の驚くべき傾向を獲得することが⽰されている． • シミュレートされたた 3D の世界に配置され，新しいデュアルコーディング外部メモリを備えた具体化されたエージェントが，従来の強化学習アルゴリズムでトレーニングされたときに同様のワンショット単語学習を⽰す． • 継続的な視覚認識と⾔語プロンプトを介して新しい物体を⼀度だけ紹介した後，エージェントは物体を再認識し，指⽰通りにそれを操作することができる． • その際，単語 (名称) の適切な参照元に関する短期的な知識とエピソードをまたいで獲得した⻑期的な語彙的・運動的知識 (何かを⾏う) をシームレスに統合する． • 本研究では，ある特定の訓練条件の下で特定の記憶書き込みメカニズムを⽤いて，エージェントのワンショットの単語ー物体結合が同じシェイプネットのカテゴリ内の新規の例題に⼀般化し，物体の数が不慣れな環境でも効果的であることを発⾒した．更に，⼆重符号化記憶が内発的な動機付けの信号として利⽤され，後の命令実⾏に役⽴ちそうな物体の名前を探すようにエージェントを刺激することができることを⽰した． • これらの結果から，ディープニューラルネットワークがメタ学習，エピソード記憶，明⽰的にマルチモーダルな環境を利⽤して，⼈間の認知発達の基本的な柱である「ファストマッピング」を説明することができ，⼈間のユーザーと対話するエージェントの潜在的な能⼒を変⾰することが実証された． http://arxiv.org/abs/2009.01719v3 Google の研究ファストマッピング: 1 回の暴露後に新しい単語を⾒慣れない物体に結合させる Top recent ⑩

Slide 60

Slide 60 text

気になった 1 本ディープニューラルネットワークにおける個々のユニットの役割の理解 (原⽂: Understanding the Role of Individual Units in a Deep Neural Network) • ディープニューラルネットワークは，⼤規模なデータセットで複雑なタスクを解決する階層的な表現を⾒つけることを得意としている． • ⼈間はどのようにしてこれらの学習された表現を理解することができるのだろうか？ • 本研究では，画像分類や画像⽣成ネットワーク内の個々の隠れたユニットの意味を体系的に特定するための解析フレームワークであるネットワーク解剖を提⽰する． 1. シーン分類で訓練された畳み込みニューラルネットワークを解析し，多様なオブジェクト概念にマッチするユニットを発⾒する． • シーンクラスの分類に重要な役割を果たす多くのオブジェクトクラスをネットワークが学習しているという証拠が得られる． 2. シーンを⽣成するために訓練された Generative adversarial network (GAN) を同様の解析⼿法を⽤いて解析する． • ⼩さなユニットのセットが活性化または⾮活性化されたときに⾏われた変化を分析することより，オブジェクトが⽂脈に適応しながら，出⼒シーンから追加・削除されることを発⾒した． 3. 解析フレームワークを，敵対的攻撃の理解とセマンティック画像編集に適⽤する． http://arxiv.org/abs/2009.05041v2 DNN の個々のユニットを統計的に分析することで明⽰的に “⽊” などの概念を与えなくてもそれらを学習しているユニットの存在を発⾒ GAN では各々の概念を司るユニットを操作することで⽣成画像を変化させることに成功気になった論⽂

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

Slide 40

Slide 40 text