Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Capsule Networkは脳に学んだか

Capsule Networkは脳に学んだか

Hinton教授(Google DeepMind)et.al.の論文Dynamic Routing Between Capsules その他で提唱されたCapsule Networkを、人間の脳内のV1視覚野の動作原理(ニューロンのカラム構造など)と比較する視点で捉えてみました。

(Capsule Networkの特徴(一部))
Max-Poolingや誤差逆伝播法を用いない点が特徴的な、
画像データを入力値として受けとるニューラル・ネットワーク・モデル。主な特徴は以下のとおり。

・ある物体を検出する上で有効となる「パーツ部品」をとらえる際に手がかりとなる「いくつかの属性」特徴量(画像中の位置や傾き、光沢感や色合いなど)を捉えることができるニューロン・ノードを、(あるパーツ部品を認識する際に同時に共起して発火するノードとして)同じ「カプセル」に収める。
・個々のカプセルからは、そのカプセルが捉えることができる「あるパーツ部品」の「いくつかの属性」の状態情報(特徴量)を、数値として並べた「ベクトル表現」を出力する。
・ベクトルどうしは、コサイン類似度等で、互いの(意味の)関連性を数学的に演算できるので、下位レイヤ内の複数のカプセルから出力される複数のベクトルどうしで、互いに関連のあるベクトルどうしを「Dynamic routing」とよばれる一種のHebb則の原理で選別して、上位レイヤのベクトルに連結(結合)させる。
・これにより、「入力画像中の各パーツの座標位置関係」や、各パーツの「傾き」や「光沢感」、「色合い」といった、複数の参照軸で、低次の意味レイヤから高次の意味レイヤに向かって、Parser tree(構文木)構造のように、階層的に意味構造を組みててていくことができる。

neuromorphic_ai

December 03, 2017
Tweet

More Decks by neuromorphic_ai

Other Decks in Technology

Transcript

  1. Capsule Networkは脳に学んだか このスライドは、Hinton et.al.によるNIPS2017論文 Dynamic Routing between Capsules で提案された Capsule

    network モデル が、 人間の大脳新皮質における視覚野の動作メカニズムを、 どれだけ取り入れているのかを、 主題的に取り上げるものです。
  2. Capsule Network論文 Sabour, S., Frosst, N. & Hinton G. (NIPS

    2017) Dynamic Routing between Capsules. http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf
  3. 【2017/12/9 事後追記】  以下の論考も、「脳に学ぶAIモデル」という視点から、Capsule Networkを、Numenta社のHTM理論やVicarious社のRecursive Cortical Networkモデルほかと並べて論じている。 Gideon Kowadlo (December

    1, 2017) agi.io by Project AGI https://agi.io/2017/12/01/new-approaches-to-deep-networks/  しかし、複数のモデルを列挙して並べてはいるものの、個々 のモデルを個別に取り上げて、解説している段階に留まって いる。  何らかの比較軸を設定して、これらのモデルを互いに比較す るところまでには、筆が及んでいない。
  4. 【2017/12/9 事後追記】 Gideon Kowadlo (December 1, 2017) agi.io by Project

    AGI https://agi.io/2017/12/01/new-approaches-to-deep-networks/
  5. 【2017/12/9 事後追記】 Gideon Kowadlo (December 1, 2017) agi.io by Project

    AGI https://agi.io/2017/12/01/new-approaches-to-deep-networks/
  6. 人間の脳のV1視覚野 コラム構造の中のある位置(=3次元座標)を指定すると、 (右眼球or左眼球由来, 特定の傾きのエッジ, 特定の色調) を検出しているニューロンを指定できる 【 色 調 】

    3つの属性でみたとき、類似属性を捉えるニューロンが、 コラム構造体の中で、隣り合って近接配置されている - 赤軸(左右どちらの眼球由来の画像情報か?) - 青軸(捉えられた色調は何か?) - 橙軸(捉えられた線分(エッジ)の傾きは何度か?) カラム構造の中の「ここの位置」にあるニューロンは、 (右眼球(R)由来の, 網膜内のある座標位置に届いた, ある色調の, 縦垂直方向のエッジ(┃)) を捉えるニューロンである。
  7. Capsule Network Capsule Network の 各カプセルも、 「複数の画像属性」の「ある組み合わせ」 の物体を検出するニューロンを、 次元数が2以上のベクトル値の形式で指定している、と見なすことができる。 (画像内の特定の座標位置,

    特定の傾き方向, 特定の色調, ・・・) 【 色 調 】 カラム構造の中の「ここの位置」にあるニューロンは、 (右眼球(R)由来の, 網膜内のある座標位置に届いた, ある色調の, 縦垂直方向のエッジ(┃)) を捉えるニューロンである。 Capusule Network