Deep Learning 完全に理解した

Deep Learning 完全に理解した AI？機械学習？はいはい、知ってる知ってる @segavvy 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk
#20 1 ディープラーニング

このお話のゴール Deep Learning は人間みたいなことができるらしい一体どんな仕組みになってるの？仕組みが分かった！ 3章に分けてお話します 🄫2021 segavvy
2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 2

第1章脳頭の中にある脳のお話 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 3

脳はすごい • 計算できる • 読める・書ける • しゃべれる • 絵だって描ける •
知識や経験で判断できる • 将来の予想もできる • 経験や訓練で効率が上がる • できることが勉強で増やせるコンピューターではそれぞれごとのプログラムが必要できることを増やすにはプログラムの追加・修正が必要脳は生まれた時にできた 1つの仕組みでなんでもできる脳はすごい！ 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 4

脳の仕組み 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 5 神経細胞がつながりあっていて他の複数の細胞から信号を受け取る信号の強さが境界を超えると
次の神経細胞へ信号を伝える次の細胞への信号の伝わりやすさや伝えるかどうかの境界はまちまち

細胞をコンピューターでマネしたら？前の神経細胞から入力を受け取り一定以上なら次へ出力する前からの伝わりやすさと次へ伝える境界は変数 🄫2021 segavvy
2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 6 1 0 1 前の細胞A 前の細胞B 次の細胞伝わりやすさ 0.6 0.2 境界 0.4 if (1 × 0.6 + 0 × 0.2 >= 0.4): 出力 = 1 else: 出力 = 0

細胞1つで AND/OR/NAND ができる左のプログラムは ★ a ・★ b ・★ を変えるだけで
3つの機能が実現できる！ 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 7 入力 A 入力 B 出力 0.5 0.5 ≧0.7 入力 A 入力 B 出力 0.5 0.5 ≧0.2 入力 A 入力 B 出力 -0.5 -0.5 ≧-0.7 AND OR NAND (Not AND) if (入力A×★ a + 入力B×★ b >= ★): 出力 = 1 else: 出力 = 0

細胞が3つあれば XOR もできる細胞1つでは XOR は実現できないが 3つ使うと実現できる 🄫2021 segavvy 2021/8/26
エンジニア達の「◦◦完全に理解した」Talk #20 8 出力 0.5 0.5 ≧0.7 入力 A 入力 B -0.5 -0.5 ≧-0.7 ≧0.2 0.5 0.5

160個あれば手書き数字も認識できる 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 9 細胞 52 細胞
53 細胞 149 細胞 151 細胞 152 細胞 160 入力 2 入力 3 入力 783 細胞 1 細胞 2 細胞 50 入力 1 入力 784 細胞 51 細胞 150 入力は 28×28の画像（784ピクセル）該当数字の出力が強くなる 0 1 9 ・・・

第1章まとめ脳の神経細胞をマネすれば細胞間の伝わりやすさと次へ伝える境界を変えるだけでできることが増やせる細胞を増やせば
複雑なこともできる伝わりやすさと次へ伝える境界を考えるのがすごく大変そう XOR ですら自力で考えるのが辛いけど...... 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 10 第2章へつづく

第2章伝わりやすさと境界の決め方大量の変数をどうやって考えるのか？ 🄫2020 segavvy 2020/5/28 完全に理解した人達の完全に理解したTalk #5
12

とりあえず 1か所変えてみる 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 13 入力は
28×28の画像（784ピクセル） ③後続の細胞に伝わる強さを再計算 ④「出力0」が強くなれば試した内容で確定弱くなった時は逆の調整（少し減らす） ①1つの画像を入力して出力を計算細胞 52 細胞 53 細胞 149 細胞 151 細胞 152 細胞 160 入力 2 入力 3 入力 783 細胞 1 細胞 2 細胞 50 入力 1 入力 784 細胞 51 細胞 150 0 1 9 ・・・細胞 52 細胞 53 細胞 149 細胞 151 細胞 152 細胞 160 入力 2 入力 3 入力 783 細胞 1 細胞 2 細胞 50 入力 1 入力 784 細胞 51 細胞 150 0 1 9 ・・・細胞 52 細胞 53 細胞 149 細胞 151 細胞 152 細胞 160 入力 2 入力 3 入力 783 細胞 1 細胞 2 細胞 50 入力 1 入力 784 細胞 51 細胞 150 0 1 9 ・・・細胞 52 細胞 53 細胞 149 細胞 151 細胞 152 細胞 160 入力 2 入力 3 入力 783 細胞 1 細胞 2 細胞 50 入力 1 入力 784 細胞 51 細胞 150 0 1 9 ・・・ ②1か所の伝わりやすさを試しに少し増やしてみる

すべて調整する 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 14 調整する変数の数：伝わりやすさ 45,200個（＝線の数）
次に伝える境界 160個（＝細胞の数）すべての変数（伝わりやすさと境界）を順番に少し変えてみて出力「0」が強くなる方向へ調整する細胞 52 細胞 53 細胞 149 細胞 151 細胞 152 細胞 160 入力 2 入力 3 入力 783 細胞 1 細胞 2 細胞 50 入力 1 入力 784 細胞 51 細胞 150 0 1 9 ・・・

どんどん調整する同様に他の数字の画像も入力して正解の出力が強くなるように調整する 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 15
細胞 52 細胞 53 細胞 149 細胞 151 細胞 152 細胞 160 入力 2 入力 3 入力 783 細胞 1 細胞 2 細胞 50 入力 1 入力 784 細胞 51 細胞 150 0 1 9 ・・・

ひたすら調整する同様にさまざまなバリエーションの画像も入力して正解の出力が強くなるように調整する 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 16
細胞 52 細胞 53 細胞 149 細胞 151 細胞 152 細胞 160 入力 2 入力 3 入力 783 細胞 1 細胞 2 細胞 50 入力 1 入力 784 細胞 51 細胞 150 0 1 9 ・・・精度を上げるため少しずつの調整を何度も繰り返す必要がある

実際にはもう少し効率よく調整 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 17 出力を境界値で0と1に判定
すると入力が少し変わっても境界を越えない限り変化しない → 調整しにくいので実際は連続値前の細胞からの入力の合計次の細胞への出力小大 1 0 A B 境界出力連続出力入力 0 0.1 入力 0 0.3 A B 途中の変数を少し変えて出力まで再計算する作業はすごく大変 → 途中の各変数が偏微分できるように出力の式を組み上げる大量にある細胞間のつながりを計算していくのが大変 → 行列計算に置きかえて効率化 → GPUで高速化 0.3 0.1

第2章まとめ伝わりやすさと次へ伝える境界の変数は実際のデータを入力に使って目的の出力が得られるように機械的な調整を繰り返して決める →
プログラムによるこのような調整作業が機械学習機械学習は脳のマネをしない仕組みでもよく使われる細胞を増やせば複雑なことができる（第1章）大量の変数調整も機械学習でプログラムにお任せ（第2章）これでなんでもできる？ 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 18 第3章へつづく

（休憩）お薦めの本と記事 🄫2020 segavvy 2020/5/28 完全に理解した人達の完全に理解したTalk #5 19 https://www.oreilly.co.jp/books/9784873117584/ https://qiita.com/segavvy/items/4e8c36cac9c6f3543ffd Python
で実装しながら仕組みが学べます

第3章いろいろな課題いろいろな課題とそれに対する取り組み 🄫2020 segavvy 2020/5/28 完全に理解した人達の完全に理解したTalk #5 20

細胞を増やすだけではダメだった機械学習は変数調整のさじ加減が難しく試行錯誤が必要細胞が増える → 変数が増える → 必要なマシンパワーも増大細胞を増やすだけでは
精度が上がらないテーマも多い細胞自体の仕組みの改良や細胞間のつなげ方の工夫が必要機械学習にはデータやマシンパワーや時間がかかるので学習済みの結果を他の用途でも使いまわしたいなどなど 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 21

細胞の機能やつなぎ方は熱い研究テーマ 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 22 THE ASIMOV
INSTITUTE.「THE NEURAL NETWORK ZOO」. https://www.asimovinstitute.org/neural-network-zoo/ ,(最終閲覧日 2021/8/14)

工夫例① 直前の出力を次の調整に使うこのような細胞を使うと入力の順番を考慮した調整ができる 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk
#20 23 出力入力入力出力を次の入力の1つとしても使う出力

これを使って文章の生成実際の小説で続く単語が出力になるよう調整する 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20
24 学習入力理想の出力 1回目吾輩は 2回目は猫 3回目猫で 4回目である 5回目ある。：：：文章の書き出しを与えるとその著者風の続きを生成してくれる生成入力出力 1回目吾輩（未使用） 2回目は（未使用） 3回目犬で 4回目である 5回目ある。：：：「吾輩は犬」だけ入力する続きは得られた出力をそのまま入力これで続きが生成されていく ※実際に単語を扱う際は「単語の埋め込み」という手法などで固定数のデータに変換します

｜｜｜｜｜｜｜｜｜｜
｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜｜工夫例② 機械学習済みの仕組みの流用画像から 4,096 個の特徴データへ変換する仕組みとして流用 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 25 入力細胞は150,528個（224 x 224 x 3 個） • • • • • ・・・ • • • • • • ・・・ • • • • • ・・ • • • • • • • ・・・ • • • • • • ・・・ • • • ペンギン！出力の細胞は 1,000 個画像を1,000種類に分類する仕組み（VGG16というモデル） • • • ・・・ • • 1つ手前の細胞は 4,096 個ここに画像の特徴が凝縮されている！

それを文章生成の仕組みと組み合わせ 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 26 学習
入力理想の出力 1回目画像の特徴データペンギン 2回目ペンギンが 3回目が雪 4回目雪に 5回目に立って 6回目立っている：：：学習済みの仕組みで特徴抽出生成入力出力 1回目画像の特徴データペンギン 2回目ペンギンが 3回目が雪 4回目雪で 5回目で寝て 6回目寝ている画像の説明文が生成できる！

第3章まとめご説明したような神経細胞をマネして複雑に組み合わせて人間みたいなことを実現する仕組みが Deep Learning Deep Learning
は課題も多く実用化も難しい世界だが研究が活発で新しい仕組みがどんどん発表されている TensorFlow や PyTorch や Keras などのライブラリを使えば主要な仕組みは簡単に試せるので遊びなら楽しい 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 27

おわりに Deep Learning は人間みたいなことができるらしい一体どんな仕組みになってるの？仕組みが分かった！このお話が Deep Learning の理解の一助になれば幸いです
ありがとうございました 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 28 これが今日のお話のゴール

参考文献・参考サイト • 斎藤康毅.「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」. オライリー・ジャパン, 2016 https://www.oreilly.co.jp/books/9784873117584/ •
斎藤康毅.「ゼロから作るDeep Learning ❷ ―自然言語処理編」. オライリー・ジャパン, 2018 https://www.oreilly.co.jp/books/9784873118369/ • THE ASIMOV INSTITUTE. 「THE NEURAL NETWORK ZOO」(最終閲覧日 2021/8/14) https://www.asimovinstitute.org/neural-network-zoo/ • AI人工知能テクノロジー.「VGG16モデルを使用してオリジナル写真の画像認識を行ってみる」 (最終閲覧日 2021/8/22) https://newtechnologylifestyle.net/vgg16originalpicture/ • かわいいフリー素材集「いらすとや」 https://www.irasutoya.com/ 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 29

Deep Learning 完全に理解した

Deep Learning 完全に理解した

segavvy

More Decks by segavvy

Other Decks in Technology

Featured

Transcript

Deep Learning 完全に理解した AI？機械学習？はいはい、知ってる知ってる @segavvy 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk

このお話のゴール Deep Learning は人間みたいなことができるらしい一体どんな仕組みになってるの？仕組みが分かった！ 3章に分けてお話します 🄫2021 segavvy

第1章脳頭の中にある脳のお話 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 3

脳はすごい • 計算できる • 読める・書ける • しゃべれる • 絵だって描ける •

脳の仕組み 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 5 神経細胞がつながりあっていて他の複数の細胞から信号を受け取る信号の強さが境界を超えると

細胞をコンピューターでマネしたら？前の神経細胞から入力を受け取り一定以上なら次へ出力する前からの伝わりやすさと次へ伝える境界は変数 🄫2021 segavvy

細胞1つで AND/OR/NAND ができる左のプログラムは ★ a ・★ b ・★ を変えるだけで

細胞が3つあれば XOR もできる細胞1つでは XOR は実現できないが 3つ使うと実現できる 🄫2021 segavvy 2021/8/26

160個あれば手書き数字も認識できる 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 9 細胞 52 細胞

第1章まとめ脳の神経細胞をマネすれば細胞間の伝わりやすさと次へ伝える境界を変えるだけでできることが増やせる細胞を増やせば

（休憩）自己紹介 🄫2020 segavvy 2020/5/28 完全に理解した人達の完全に理解したTalk #5 11 @segavvy IT企業でセールスコンサルタントを担当している元エンジニア全文検索|自然言語処理|機械学習|企画|マーケ|ドラクエ好き|

第2章伝わりやすさと境界の決め方大量の変数をどうやって考えるのか？ 🄫2020 segavvy 2020/5/28 完全に理解した人達の完全に理解したTalk #5

とりあえず 1か所変えてみる 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 13 入力は

すべて調整する 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 14 調整する変数の数：伝わりやすさ 45,200個（＝線の数）

どんどん調整する同様に他の数字の画像も入力して正解の出力が強くなるように調整する 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 15

ひたすら調整する同様にさまざまなバリエーションの画像も入力して正解の出力が強くなるように調整する 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 16

実際にはもう少し効率よく調整 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 17 出力を境界値で0と1に判定

第2章まとめ伝わりやすさと次へ伝える境界の変数は実際のデータを入力に使って目的の出力が得られるように機械的な調整を繰り返して決める →

（休憩）お薦めの本と記事 🄫2020 segavvy 2020/5/28 完全に理解した人達の完全に理解したTalk #5 19 https://www.oreilly.co.jp/books/9784873117584/ https://qiita.com/segavvy/items/4e8c36cac9c6f3543ffd Python

第3章いろいろな課題いろいろな課題とそれに対する取り組み 🄫2020 segavvy 2020/5/28 完全に理解した人達の完全に理解したTalk #5 20

細胞を増やすだけではダメだった機械学習は変数調整のさじ加減が難しく試行錯誤が必要細胞が増える → 変数が増える → 必要なマシンパワーも増大細胞を増やすだけでは

細胞の機能やつなぎ方は熱い研究テーマ 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 22 THE ASIMOV

工夫例① 直前の出力を次の調整に使うこのような細胞を使うと入力の順番を考慮した調整ができる 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk

これを使って文章の生成実際の小説で続く単語が出力になるよう調整する 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20

｜｜｜｜｜｜｜｜｜｜

それを文章生成の仕組みと組み合わせ 🄫2021 segavvy 2021/8/26 エンジニア達の「◦◦完全に理解した」Talk #20 26 学習

第3章まとめご説明したような神経細胞をマネして複雑に組み合わせて人間みたいなことを実現する仕組みが Deep Learning Deep Learning

おわりに Deep Learning は人間みたいなことができるらしい一体どんな仕組みになってるの？仕組みが分かった！このお話が Deep Learning の理解の一助になれば幸いです

参考文献・参考サイト • 斎藤康毅.「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」. オライリー・ジャパン, 2016 https://www.oreilly.co.jp/books/9784873117584/ •