2017-deep-learning-and-psychology-gakusyuin-03

心理学特殊講義（深層学習の心理学的解釈）第3 回 2017 年04 月21 日浅川伸一 [email protected] 重要: 来週4
月28 日は休講質問があったらつぶやくハッシュタグ #2017dl_gak 初めての相手とペアを組んで座ってください前回の資料は https://speakerdeck.com/shinasakawa/2017-deep-learning-and-psychology-gakusyuin-02 今回の資料は https://speakerdeck.com/shinasakawa/2017-deep-learning-and-psychology-gakusyuin-03 本日のメニュー 1. ゲストスピーカーズトーク(16:25-16:40) 2. 休講分の課題(16:40-16:50) 3. ニューラルネットワークの歴史(16:50-17:00) スキップするかも 4. 論理回路の設計(17:10-17:40) 5. 討論(17:40-17:50) 人間の感情と、他の生物のそれと、近代的な型の自動機械の反応との間に鋭い乗り越えられない区画線を引く心理学者は、私が私自身の主張に慎重でなければならないのと同様に、私の説を否定するのに慎重でなければならない N. Wiener (1950) The Human Use of Human Beings ( 人間機械論, みすず書房, p.73 より) Nevertheless, it is interesting to know that the sort of phenomenon which is recorded subjectively as emotion may not be merely a useless epiphenomenon of nervous action, but may control some essential stage in learning, and in other similar processes. I deﬁnitely do not say that it does, but I do say that those psychologists who draw sharp and uncrossable distinctions between man’s emotions and those of other living organisms and the responses of the modem type of automatic mechanisms, should be just as careful in their denials as I should be in my assertions. ゲストスピーカーズトーク全脳アーキテクチャ若手の会http://wbawakate.jp/ 八木拓真さん，松岡佑磨さん http://ainow.ai/ 亀田重幸さん休講分の課題 1. ICLR2017 workshop の openreview の中から興味のある発表を選ぶ https://openreview.net/group? id=ICLR.cc/2017/workshop

2. PDF ファイルをダウンロードして書かれている内容の理解を進める。専門用語について調べて提出たとえば Dance Dance Convolution なんて面白いのでは？
ペア人チームで一つのプレゼンを読み解く PDF ファイル中に出てくる専門用語をチーム内で手分けして調べるまとめてチームとして提出提出期限 5 月11 日木曜日23:59 提出先 [email protected] 用いる記号の意味 ( 再録) 機械学習は統計学の一分野であるので，統計学の伝統に従った表記が用いられる場合が多い。 1. ローマンアルファベットは通常の変数: e.g. , , , , 2. ギリシャアルファベットは母数( 母集団を記述する変数) , , , , e.g. サンプリングしたデータの平均値をローマンアルファベット対応する母集団の平均値をとするなど 3. ただし，ギリシャアルファベットとローマンアルファベットはこの規則に従わない場合も多数 4. 単にギリシャアルファベットとローマンアルファベットでは変数の意味合いが違うというだけの場合もある 5. 例えばをロジスティックシグモイド関数 logistic sigmoid function とするなど。数の次元による表記の違い次数日本語 English 表記例 0 スカラ scalar 1 ベクトル vetor 2 行列 matrix 3- テンソル tensor その他の注意下付き文字 subscript は同じ変数の異なる要素を指す e.g. , 上付き文字は superscript はべき乗を表す。場合によっては下付き文字だけで煩雑になる場合にも用いられる e.g. , , 総和記号高校数学で悩まされた数列と考えずに足し算と考える ×2 = 4 x y a b … μ σ θ ω … ¯ x μ σ a a A A x1 ai x p a (1) x (hidden) i ∑ n = + + … + .

e.g. 条件付き確率 conditional probability は ''p of x given D''
と読む。直訳すればが与えられた場合のの確率と言う意味になるまぎらわしいがあるけれど詳しすぎるので今は省略期待値 expectation value カッコの区別 , , は割りと適当。わかりやすさ優先の感じ。ただしカッコの開閉の対応は厳密がで終わったりしない 2.4 最速で理解するには( スキップ) 1. 線形回帰 linear regression 2. ロジスティック回帰 logistic regression 3. 正則化 regularization 4. 多層パーセプトロン multi-layered perceptrons 5. 畳み込みニューラルネットワーク convolutional neural networks 6. リカレントニューラルネットワーク recurrent neural networks 7. 強化学習 reinforcement learning 8. 変分法 2.5. 良い知識( スキップ) 1. 初等解析学 2. 線形代数 3. 確率論 4. 統計学 5. プログラミング言語(C, C++, Python, java, ruby, shell scripts, javascript, Haskell, Scala, ...) 6. markdown, jeykll 7. GitHub, 8. Linux の基礎知識(Ubuntu 推奨，MacOS では不十分) 9. GPU (NVIDIA 一択) 10. GURU 4. 実装( スキップ) ∑ n i=1 xi = x1 + x2 + … + xn . p (x |D ) D x f (w |D ) (1) || E [x] { ( [ ( ]

1. Python, Theano, Chainer, TensorFlow, Keras, CNTK, PyTourch, sonnet, 2.
MATLAB, octave 3. Java DeepLearing4j 4. C, C++ Caffe 5. Torch Touch 6. BLAS, openblas, ATLAS, MKL Excel R(H20) frameworks Python/Java C, C++, 4.1 デモ( スキップ？？？？) TensorFlow playground http://playground.tensorﬂow.org/ Convnet.js http://cs.stanford.edu/people/karpathy/convnetjs/ マイクロソフトのキャプションボット https://www.captioinbot.ai Alex graves, 手書き文字生成 http://www.cs.toronto.edu/~graves/handwriting.html] Ink Poster: Handwritten post-it notes http://www.inkposter.com/? すぎゃーんさんのブログ http://memo.sugyan.com/entry/2016/11/28/131952 prisma http://touchlab.jp/2016/07/prisma_app_review/ pix2pix https://afﬁnelayer.com/pixsrv/ 自分でプログラムを動かしてみたいという人のために( スキップ) 必要なもの OS: Mac OS, or Ubuntu (Windows だと苦労する) 処理系: Python 2.7, 3.6 Anaconda を推奨 docker を利用することもあるフリーの MOOCS を利用するのも手です研究会，勉強会に参加してみる，主催してみる ( 全脳アーキテクチャ若手の会とか) 2.6. AI の進歩の 5 つの要因( スキップ) 1. 計算 ( ムーアの法則，GPUs, ASICs), 2. データ (e.g. ImageNet), 3. アルゴリズム (e.g. バックプロパゲーション, CNN, LSTM), 4. 基盤 (Linux, TCP/IP, Git, ROS, PR2, AWS, AMT, TensorFlow, etc.). 5. 情報共有 (arXiv.org) 閑話休題( スキップ) > > > > …

現在の言語情報処理モデルの趨勢は Chomsky の思い描いた方向には進んでいない( ように見える) 心理学史を紐解けば，スキナーを批判して行動主義心理学を終わらせる功績が特筆されるその結果，言語は生得的であるとのラジカルな立場をとることになったのは御存知の通り 3. ニューラルネットワークの歴史第一次ニューロブーム 1950
年代ウォーレン・マッカロックとワイルダー・ピッツによる形式ニューロンの提案 ( サイバネティクスの創始者ノーバート・ウィーナーの集めた研究者集団) ウォーレン・マッカロック( 左) とワイルダー・ピッツ( 右) 形式ニューロンは，シナプス結合荷重ベクトルと出力を決定するための伝達関数とで構成され次式 () で表現される。ここでは番目のニューロンの出力，は番目のニューロンの出力，はニューロンととの間のシナプス結合荷重である。は活性化関数と呼ばれる。 y i = ϕ (∑ j w ij x j ) , (2) y i i x j j w ij i j ϕ

図 1: 形式ニューロン 3.1.2 ローゼンブラット Rosenblatt のパーセプトロン図 2: ローゼンブラット
図 3: パーセプトロンの模式図ミンスキーとパパート「パーセプトロン」より 1960 年ミンスキー(Minsky, Marvin) とパパート(Papert, Seymour) によるパーセプトロン批判

マーヴィン・ミンスキー( 左) とシーモア・パパート( 右) 第一次氷河期凍てつく寒さの中，日本人パイオニアは奮闘！ - 甘利俊一先生, 中野馨先生, 福島邦彦先生
3.2 第二次ニューロブーム 1986 年 PDP ブック出版( 誤差逆伝播法の提唱) 左からディビッド・ラメルハート, ジェイ・マクレランド，ジェフェリー・ヒントン, PDP 本 vol.1 1989 年，バプニック，サポートベクターマシン発表第二次氷河期 ANNs are some kind of non-linear statistics for amateurs J.A. Anderson, A. Pellionisz, E. Rosenfeld (eds.), Neurocomputing 2: Directions for Research, MIT Press, Cambridge (1990), Massachusetts 3.3 第3 次ニューロブーム (AI ルネッサンス，第4 次産業革命)

図 4: 大規模画像認識チャレンジの結果 2013 ICLR スタート arXiv.org に予め論文を投稿，誰でも読める，誰でも批判できる。著者はそれに答えなければならない。あっという間にトップカンファレンスとなる 2013
Mikolov word2vec を発表図 5: Mikolov の類推課題セマンティッ・クデファレンシャル法と異なる計算意味論 18 世紀第1 次産業革命: 蒸気機関，都市部に大規模工場が出現 20 世紀初頭第2 次産業革命: 電気，オートメーション化，自動車，飛行機，電車による移動手段の変化 20 世紀後半第3 次産業革命: 情報化，コンピュータ化，グローバル化 21 世紀から第4 次産業革命: AI 人間の能力を越える機械 2013 DeepMind DQN を発表

図 6: DQN の結果 our project 2014 Neural Image Captioning
が注目を集める。

図 7: Human: A group of men playing Frisbee in
the park. Machine: A group of young people playing a game of Frisbee. 図 8: Vinyals et. al (2014) より

2015 画像生成技術が注目を浴びる図 9: 天安門前広場の夢( 撮影は自民解放軍の兵士に依頼した) 2015 人工知能学会が日本では「深層学習」と呼ぶことに決定する 2016 GAN
が注目を浴びる図 10: Generative Adversarial Text to Image Synthesis arXiv:1605.05396v2

図 11: Generative Adversarial Text to Image Synthesis arXiv:1605.05396v2 2016
アメリカ合州国大統領候補の一人の発言を模倣する「ディープトランプ」がツィッター上で注目を集める 2016 アルファ碁がイ・セドルを破る

図 12: アルファ碁 Nature よりローゼンブラットのパーセプトロンニューロン脳は莫大な数( 個以上ともいわれる) の神経単位(
ニューロン neuron) から成り立っている。このニューロンが脳の情報処理における基本単位である。複数のニューロンが結合してニューラルネットワークが形成されている。個々のニューロンは、単純な処理しか行なわないが、脳はこのニューロンが相互に結合された並列処理システムであると捕えることができる。図 13: 脳内のさまざまなニューロンニューロンは、 1. 細胞体 cell body 2. 樹状突起 dedrite 3. 軸索 axon とよばれる部分からなる。樹状突起はアンテナ( 入力) 、軸索は送電線( 出力) と考えれば分かりやすい。ニューロンの内部と外部とでは , イオンなどの働きにより電位差がある。通常、内部電位は外部よりも低い。外部を 0 としたときの内部の電位を膜電位という。入力信号が無いときの膜 10 10 N a + K +

電位を静止膜電位という。% 約ぐらいである。情報は樹状突起から電気信号の形でニューロンに伝達され、すべての樹状突起からの電気信号が加え合わされる。樹状突起からやってくる外部電気信号の影響で膜電位が一定の値 ( しきい値
約 ) を越えると約 1 msec の間膜電位が急激に高くなる。このことをニューロンが興奮した( あるいは発火した) という。ニューロンの興奮は、軸索をとおって別のニューロンに伝達される。図 14: ニューロンの模式図 wikipedia より図 15: 形式ニューロン電位変化に現われる興奮( パルス) 、不応期などの概念を下図によって確認図 16: 膜電位の変化, GENESIS という有名なシミュレータの出力結果 GENESIS の中の Neuron というスクリプトによって出力される結果を示した。ニューロンの動作はホジキン・ハックスレー方程式 (Hodgkin & Huxley(1952), しばしば H-H 方程式などと略記される) に従うものとしてシミュレーションが行われている。 H-H 方程式は , , などの濃度勾配を基づいた膜電位の変化を記述するコンダクタンスベースのニューロンの動作方程式の代表例 −70mV −55mV N a + K + Ca +

ニューロンの興奮(1 msec だけなのでパルス pulse と呼ぶことがある) は軸索をとおって他のニューロンに伝達される。軸索を通る興奮の伝達速度は 100 m/s
くらいである。たとえば、文字を見て音声を発声するまでの応答時間は、たかだか、1 秒程度で、ニューロンの応答時間を 10 数ミリ秒とすると多めに見積もっても 100 程度のニューロンしか通過していないことになる。このことは「100 step のプログラムの制約」と呼ばれる。神経細胞の結合様式シナプスに興奮が到達するたびに送り手側( シナプス前ニューロン) のニューロンからある種の化学物質が放出される。この化学物質は受け手側( シナプス後ニューロン) の膜電位をわずかに変化させる。送り手のシナプスの興奮が興奮的に働くか抑制的に働くかは、送り手の側の細胞の種類によって異なることが知られている(Dale の法則) 。一つのニューロンには多いもので数万個のシナプス結合が存在する。多数の軸索にシナプス結合を通して興奮( あるいは抑制) が伝えられると細胞体を伝わる途中で重なり合う。すべての膜電位の変化の総和によってニューロンの膜電位の変化が決定される。すべてのシナプス結合の和のことを空間加算という。あるシナプスによって膜電位が変化し、その変化が減衰する前に次の興奮が伝達されれば、まだ残っている直前の電位変化に加え合わされて膜電位の変化が起きる。このことを時間加算という。シナプスに興奮が到達すると 0.3 msec 程度の時間遅れの後シナプス結合部の膜電位がわずかに変化する。１つのシナプスが生成する膜電位の変化は 0.1 mV から 30 mV ぐらいのものまで様々なシナプス結合が存在する。樹状突起を介したニューロン間の結合の強さは、しばしば変化することが知られている。これを学習という。多入力一出力という単純化図 17: ステップ関数 y = sign ( N ∑ i=1 wi xi + b) (3)

3.1.3 パーセプトロンの学習パーセプトロン perceptron は 3 層の階層型ネットワークでそれぞれ S(sensory layer), A(associative
layer), R(response layer) と呼ぶ。のうちパーセプトロンの本質的な部分はの間の学習にある。入力パターンにととがある。パーセプトロンはが入力されたとき , のときを出力する機械である。出力層( ) の番目のニューロンへの入力( 膜電位の変化) はここで中間層( ) の番目のニューロンの出力とこのニューロンとの結合係数を、しきい値をとした。このニューロンの出力 ( 活動電位、スパイク) は、と表される。論理回路の設計基本的な論理回路と簡単な記憶回路を神経回路網で構成する方法を考えてみます。シリコンウェハ上に構成される論理回路をニューロン素子でも実現できることを示し以下に引用したウィーナーの言葉を裏付ける根拠を示すことにします。 AND ( 論理積) 回路 2 入力 1 出力の回路において、2 つの入力が共に真であるときのみ真を出力し、そうでなければ偽となる論理演算である論理積 (AND) を考えます。論理積は引数を 2 つとる演算であり、出力をとすればのように書くことができます。 , ともに 1 または 0 の値をとるものとすれば、が 1 であるためにはかつでなければなりません w ← w + (y − ^ y ) x (4) S → A → R A → R P + P − P + 1 P − 0 R i ui ui = ∑ j wij xj − θi = (w) i ⋅ (x) i − θi . A j yi wij θi yi yi = ⌈ui ⌉ { 1 if ui ≥ 0, 0 otherwize (5) y = sign ( N ∑ i=1 wi xi + b) (6) y y = f(x1 , x2 ) x1 x2 y x1 = 1 x2 = 1

OR ( 論理和) 回路 NOT ( 否定) 回路排他的論理和 (XOR)
回路図 18: xor PDP book (1986) chapter 8 Figure 2

内部表象おそらく人類史上初，哲学的な意味ではなく内部表象が計算可能になった排他的論理和の別解図 19: PDP book (1986) Chapt.8 Fig.2
より簡単な記憶回路フリップフラップ回路

AND 素子と NOT 素子とを繋いで簡単な記憶回路を作ることができる図 20: 図で各素子はかかを値として取りうる形式ニューロン
だとする。今、入力と入力とが共にであれば , あるいは , のときだけこの回路は安定である。ここで , とすると , の状態になり、 , とすると , の状態になる。しかも、この状態はに入力を戻しても保存される。これはビットの記憶回路でありフリップフラップ回路 (ﬂip-ﬂop circuit) と呼ばれる。このことは AND と NOT を実現できる神経回路素子があれば記憶回路を作ることができることを示している。しかも工学的に実現されている回路と完全に等価である。フリップフロップ回路を何個かまとめてレジスタ (register) と呼ぶ。市販されている PC の CPU の性能を指して 64 ビットマシンと呼ぶのは、このレジスタの大きさ( 記憶装置への基本的な入出力単位の基本でもある) による。一般にコンピュータの速度はこのフリップフラップ回路が安定するまでの時間に依存します。なぜなら、コンピュータの基本動作は原理的に、上述のフリップフラップ回路が安定するのを待って、次の命令をレジスタに読み込むことの繰り返しだからである。ニューラルチューリングマシン Graves et.al,(2014) 図 21: Neural Turing Machines, Graves et. al.(2014) ニューラルチューリングマシンの意味するところ人間の脳を模したニューラルネットワーク NN で論理回路が定義できる。かつ，NN は論理回路を学習可能，訓練可能 1 0 x y 1 A = 1 B = 0 A = 0 B = 1 x = 0 y = 1 A = 0 B = 1 x = 1 y = 0 A = 1 B = 0 x = y = 1 1

NN 上でチューリングマシン NTM が定義できるかつ，NTM は学習可能，訓練可能 NTM 上で NN をプログラム可能(
実装例は未だなし) NTM 上で定義された NN で論理回路は定義可能 NTM 上で定義された NN で NTM は実装可能以上を NN(0) NTM(1) NN(1) NTM(2) と可能かチューリングマシンはすべてのプログラム可能なアルゴリズムを実装できる。人間の知性は実装できるかどうかは，人間の知性がチューリングマシンと同等の性能を持つか否かまとめ Geist in silico 浅川の造語 Geist im Nets へのオマージュ人間の感情と、他の生物のそれと、近代的な型の自動機械の反応との間に鋭い乗り越えられない区画線を引く心理学者は、私が私自身の主張に慎重でなければならないのと同様に、私の説を否定するのに慎重でなければならない N. Wiener, The Human Use of Human Beings( 人間機械論, みすず書房, p.73) Nevertheless, it is interesting to know that the sort of phenomenon which is recorded subjectively as emotion may not be merely a useless epiphenomenon of nervous action, but may control some essential stage in learning, and in other similar processes. I deﬁnitely do not say that it does, but I do say that those psychologists who draw sharp and uncrossable distinctions between man’s emotions and those of other living organisms and the responses of the modem type of automatic mechanisms, should be just as careful in their denials as I should be in my assertions. 反論するなら，その拠り所となる根拠が必要だと思う。本日のポイント 1. 形式ニューロン 2. 論理回路 3. 線形分離可能性 4. パーセプトロン 5. パーセプトロンにおける学習 → → → ⋯

2017-deep-learning-and-psychology-gakusyuin-03

2017-deep-learning-and-psychology-gakusyuin-03

Shin Asakawa

More Decks by Shin Asakawa

Other Decks in Education

Featured

Transcript

心理学特殊講義（深層学習の心理学的解釈）第3 回 2017 年04 月21 日浅川伸一 [email protected] 重要: 来週4

2. PDF ファイルをダウンロードして書かれている内容の理解を進める。専門用語について調べて提出たとえば Dance Dance Convolution なんて面白いのでは？

e.g. 条件付き確率 conditional probability は ''p of x given D''

1. Python, Theano, Chainer, TensorFlow, Keras, CNTK, PyTourch, sonnet, 2.

図 1: 形式ニューロン 3.1.2 ローゼンブラット Rosenblatt のパーセプトロン図 2: ローゼンブラット

マーヴィン・ミンスキー( 左) とシーモア・パパート( 右) 第一次氷河期凍てつく寒さの中，日本人パイオニアは奮闘！ - 甘利俊一先生, 中野馨先生, 福島邦彦先生

図 4: 大規模画像認識チャレンジの結果 2013 ICLR スタート arXiv.org に予め論文を投稿，誰でも読める，誰でも批判できる。著者はそれに答えなければならない。あっという間にトップカンファレンスとなる 2013

図 6: DQN の結果 our project 2014 Neural Image Captioning

図 7: Human: A group of men playing Frisbee in

2015 画像生成技術が注目を浴びる図 9: 天安門前広場の夢( 撮影は自民解放軍の兵士に依頼した) 2015 人工知能学会が日本では「深層学習」と呼ぶことに決定する 2016 GAN

図 11: Generative Adversarial Text to Image Synthesis arXiv:1605.05396v2 2016

図 12: アルファ碁 Nature よりローゼンブラットのパーセプトロンニューロン脳は莫大な数( 個以上ともいわれる) の神経単位(

ニューロンの興奮(1 msec だけなのでパルス pulse と呼ぶことがある) は軸索をとおって他のニューロンに伝達される。軸索を通る興奮の伝達速度は 100 m/s

3.1.3 パーセプトロンの学習パーセプトロン perceptron は 3 層の階層型ネットワークでそれぞれ S(sensory layer), A(associative

OR ( 論理和) 回路 NOT ( 否定) 回路排他的論理和 (XOR)

内部表象おそらく人類史上初，哲学的な意味ではなく内部表象が計算可能になった排他的論理和の別解図 19: PDP book (1986) Chapt.8 Fig.2

AND 素子と NOT 素子とを繋いで簡単な記憶回路を作ることができる図 20: 図で各素子はかかを値として取りうる形式ニューロン

NN 上でチューリングマシン NTM が定義できるかつ，NTM は学習可能，訓練可能 NTM 上で NN をプログラム可能(