Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI(人工知能)の過去・現在・未来―AIは人間を超えるのか―

Y-h. Taguchi
August 31, 2018

 AI(人工知能)の過去・現在・未来―AIは人間を超えるのか―

2018年度中央大学学術講演会
AI(人工知能)の過去・現在・未来
―AIは人間を超えるのか―

中央大学理工学部物理学科

田口善弘
宮崎支部・香川支部
香川支部講演
https://youtu.be/ht2TqZgFLkQ
宮崎支部講演
https://youtu.be/ZPqEGnyPrPg

Y-h. Taguchi

August 31, 2018
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. 1
    AI(人工知能)の過去・現在・未来
    ―AIは人間を超えるのか―
    中央大学理工学部物理学科
    田口善弘

    View full-size slide

  2. 2
    AIをめぐる最近の話題.....
    グーグルの完全無人タクシー
    完全無人タクシー、ついに運行を開始
    「このタクシーはアルファベット(グーグル)傘下のウェイモ
    (Waymo)が保有する(アリゾナ州フェニックス郊外)」

    View full-size slide

  3. 3
    基礎研究に150億ドル投資
    アリババの「中国式AI」は世界を席巻するのか?

    View full-size slide

  4. 4
    アリババはすでに人工知能(AI)と機械学習
    機械学習を
    使って製品開発。
    例:
    ・サプライチェーンの最適化
    ・ユーザーに個別化した推奨の表示
    ・アマゾン・エコー(Amazon Echo)に似た家庭用
    機器である「Tモール・ジーニー(Tmall Genie)

    View full-size slide

  5. 5
    資金投入について
    資金投入について
    TencentとBaiduもAI研究に巨額の資金を投入
    (テンセントとバイドゥは中国のテクノロジー界の
    超巨大企業)。
    中国政府は、2030年までに、約1500億ドル規模
    のAI産業を構築しようと計画。
    中国研究者に、他国より優位に立つよう要求。

    View full-size slide

  6. 6
    一方で....
    「GoogleのAIのトップは曰く、人工知能という言葉
    自体が間違っている、誇大宣伝を生む温床だ」
    Googleエンジニアリング部門のSVP John Giannandrea
    が、TechCrunch Disrupt SFで、人工知能に関する優れた談話を
    語った。とくに彼は、人びとは汎用の人工知能に対して心配しすぎ
    だ、と考えている。

    View full-size slide

  7. 7
    今日は、いわゆるAIとはどういうもので、
    何ができて何ができなくて、将来我々の
    生活にどういう影響があるかということ
    を説明してみたい。

    View full-size slide

  8. 8
    AI(機械学習)ができること
    ○画像から物体認識
    https://pjreddie.com/darknet/yolo/
    Y
    You o
    only l
    look o
    once (YOLO
    YOLO)
    非常に高速な物体認識ソフト。
    動画のリアルタイム認識が可能になった
    (動画は一秒間30コマ程度)。

    View full-size slide

  9. 9
    言語の処理にも機械学習
    機械学習は使われている。
    例えば、機械翻訳の分野...。

    View full-size slide

  10. 10
    ○google翻訳(https://translate.google.co.jp)
    戦時中は「敵」という言葉がひんぱんに使われた。
    日常生活にも及び、英語が「敵性語」とされて、サイ
    ダーは噴出水、フライは洋天になった。学校では青い
    目をした人形が、「敵性人形」と言われ焼かれた。
    「ぜいたくは敵だ」の標語もあった。
    (2018年4月21日「天声人語」冒頭)
    During the war the word "enemy" was used
    frequently. Even in daily life, English is
    regarded as "enemy word", cider gushed
    water, fly became Western-style. At school the
    doll who had blue eyes was said to be "enemy
    doll" and baked. There was also a slogan
    "Luxury is an enemy"

    View full-size slide

  11. 11
    ○AlphaZero
    囲碁、将棋、チェスなどの1対1の盤面対戦ゲームの
    汎用ソフト
    汎用ソフト。
    自己対決(一人将棋、ということ)だけで、ルール以
    外、誰にも全く教えてもらわず......。
    成果1.
     学習時間3時間で最強チェスソフトに
    勝つ強さに。

    View full-size slide

  12. 12
    成果2.
     学習時間8時間で既存最強囲碁ソフト
    (人間のチャンピオンに勝った)と100戦60勝
    40敗と勝ち越し。

    View full-size slide

  13. 13
    もはや誰かに教えてもらうのじゃなく自分で
    勝ち方を発見できる! 
    しかも、ゲームルールに依らない汎用性
    ゲームルールに依らない汎用性が
    ある....。
    成果3.
    (学習時間不明)最強将棋ソフト
    (もちろん、羽生さんよりもはや強
    いです)と100戦して90勝。

    View full-size slide

  14. 14
    それでは、なんでAI(機械学習
    機械学習)はこういう今
    までは難しかったことが急にできるようになっ
    たのか、最近のAIと大昔やちょっと昔のAIは
    何が違うのか、ということから説明したい。

    View full-size slide

  15. 15
    いわゆる元々のAI:
    いわゆる元々のAI:
    人間の思考をプログラミングで実現する。
    例:将棋ソフト
    ①まず、ある盤面に対して可能な次の一手を
     全部考えさせる。
    ②次に、人間が「見込みのなさそうな手」を判断し、
     候補から削除する。
    ③残った候補手の次の一手を考える。②を繰り返す。
    ④なるべく先の手まで考えてから最善手を選んで
     コンピュータが指す。

    View full-size slide

  16. 16
    この様なやり方の利点:
    この様なやり方の利点:
    コンピュータが「なぜ、その手を指したか」を人間
    は完全理解できる。
    この様なやり方の欠点:
    この様なやり方の欠点:
    考えなくてはいけない手の候補数があっという間
    に膨大な数になる。
    → 仮に一手当たり10通りの「良さそうな手」が
    あったとする。10手先(自分が5手、相手が5手)ま
    で考えると1010=100億通りの手を考えないとい
    けない。

    View full-size slide

  17. 17
    1
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    1
    10 100
    1000
    10000
    1010=100億
    ・・・・・・

    View full-size slide

  18. 18
    コンピュータ:GHz=10億回/秒。
    100億/10億=10秒
    (もちろん、上記「一回」でできることは「1と0を
    足す」みたいな演算なので「一回」で「一手の
    良し悪し」を判断するのは到底無理である)
    将棋:早指し=持ち時間切れたら30秒/一手
    時間が全然間に合わない....。

    View full-size slide

  19. 19
    そこで.... 機械学習
    従来のAIと機械学習の違い。
    機械学習
     =「正解」をたくさん持ってきて学習する。
    コンピュータ将棋:Bonanzaの登場(2006年)
    製作者は日本人の化学者
    (将棋は素人)。

    View full-size slide

  20. 20
    特徴:
    特徴:
    ・過去の六万局の棋譜データを探索。
    ・「現在の局面」に「似たもの」を探して次の手
    を考える、をなるべく先の手まで考える。
    ・一番得点が高い手を指す。
    ①手の良し悪しの判断は人間がしない
    人間がしない
    ②「似たもの」の定義は人間がする。
    人間がする。
     →従来AI型の将棋ソフトにバカ勝ちした。

    View full-size slide

  21. 21
    人間が考えるよりデータに学ぶほうが良い
    場合がある!
    (過去の棋譜はプロ棋士のものなので「良
    い手=正解」が多いと期待できた)
    → しかし、「何が似ているか」は人間が考
    人間が考
    えていた。
    えていた。
    → 最新のAI=機械学習では「何が似てい
    るか」もコンピュータが決めている。
    コンピュータが決めている。

    View full-size slide

  22. 22
    ①適当に「似ている」
    という基準を作る。
    ②「似ている」という基準を
    ランダムにちょっと変更
    対戦


    またちょっと変える

    対局させる

    良かった方を採用
    十分強くなるまで
    「似ている」の基準
    を更新し続ける
    過去の棋譜

    View full-size slide

  23. 23
    こうやって「似ている」という
    基準を「より強くなる」ように
    自動的に変えることで人間
    人間
    が考えなくて良くする
    が考えなくて良くする。
    同じ発想でいろんなことが可能になる。

    View full-size slide

  24. 24
    画像からの物体認識の場合
    人物
    学習
    人物

    View full-size slide

  25. 25
    機械翻訳
    This is a pen. これはペンです
    学習
    This is a pencil. これは鉛筆です

    View full-size slide

  26. 26
    AlphaZero:自己対戦
    “Mastering the game of Go without human knowledge”
    Nature volume 550, pages 354–359 (19 October 2017)
    更に進んで「過去のデータ」さえ用いない......。
    →「過去の棋譜」は自己対戦
    自己対戦で作る

    View full-size slide

  27. 27
    +「似ていること」の基準A
    セット1:ランダム作成
    棋譜A
    +「似ていること」の基準B
    セット2:ランダム作成
    棋譜B
    自己対戦⇕
    自己対戦⇕
    +「似ていること」の基準B’
    セット3:セット2をちょっと変えて作成
    棋譜B’
    ⇑棋譜Bからちょっと変更 ⇑「似ていること」の基準B
    からちょっと変更
    自己対戦⇕
    自己対戦⇕

    View full-size slide

  28. 28
    セット(旧) セット(新)
    作成
    対戦
    セット(新)勝利!
    セット(旧)→消去
    セット(新)→セット(旧)
    YES
    YES
    NO
    NO
    セット(新)→消去
    これを十分強くなるまでひたすら繰り返す
    これを十分強くなるまでひたすら繰り返す
    棋譜+「似ている」のルール
    過去の棋譜不要!

    View full-size slide

  29. 29
    最近、AIと呼ばれている機械学習がなぜ今までは
    なぜ今までは
    できなかったことができていろんなことが可能に
    できなかったことができていろんなことが可能に
    なったのか
    なったのかの基本は
    「データから何かを出す(画像の中の物体の認識、
    日本語を英語に翻訳する、将棋・囲碁・チェスで勝
    つ)は、たくさんの
    データ ⇔ 正解
    の組から「自動的に」学習する方が人間が考える
    人間が考える
    よりも高性能がでる
    よりも高性能がでる」
    という事実の発見にある。

    View full-size slide

  30. 30
    …..が、これではいくらなんでも具体的
    なことがわからないのですごく簡単な
    例で「機械学習
    機械学習」を体験する。

    View full-size slide

  31. 31
    3 9 3 2 2 7 5 3 1 9
    5 9 5 8 4 5 2 10 5 7
    7 9 1 7 7 1 3 4 5 7
    2 8 6 1 2 5 1 5 1 2
    4 8 7 2 1 10 4 7 4 7
    5 6 9 4 6 4 10 4 2 5
    10 10 3 7 10 8 7 6 10 6
    6 3 7 9 4 10 10 7 7 9
    10 10 5 9 5 9 9 1010 10
    10 9 2 6 5 8 9 1 8 1
    2393
    2393
    左の100個の数
    字から右の4桁
    が作られている。
    どういうルールで
    しょう?
    4番目の数字の1000倍
    +3番目の数字の100倍
    +2番めの数字の10倍
    +1番目の数字
    データ 答え
    データと答えの組から学習してデータが与えられ
    たら答えを作れるようになれるか?

    View full-size slide

  32. 32
    「100個の数字の内の何個かをそれぞれ何倍
    かして答えを作っているが、それは何番目の数
    字でそれぞれ何倍にしているのか?」
    という問題なら、「データと答えの組」が100個
    あれば
    連立一次方程式
    の方法で解ける。

    View full-size slide

  33. 33
    1 10 100 1000
    予測


    何番目の数字を
    何倍するか?
    連立一次方程式
    答え

    View full-size slide

  34. 34
    しかし、機械学習はその方法を知
    らなくてもこの問題を解ける
    (そして、解法がわからない問題
    を強引に解くことができるのが機
    械学習の方法)。

    View full-size slide

  35. 35
    (従来型の)機械学習の方法
    (従来型の)機械学習の方法
    「適当な数字に適当な数をかけて足す」と仮定
    (例えば、1,5,7,9番目の数字を6倍、8倍、9倍、
    2倍して足す)

    多数の「データと答えの組」に試す。

    当然、全然合わない。

    「仮定」をちょっと変えて試す。

    もし、一致度が上がったら採用。
    ダメだったら他の仮定を試す。

    View full-size slide

  36. 36
    →こんな稚拙なやり方でもたくさんの組
    (例えば1万組)と長い計算時間があれ
    ば答えに達することが可能。
    →これだとまだ「何がいいか」を人間が
    仮定しているレベル。

    View full-size slide

  37. 37
    何番目の数字を
    何倍するか?
    予測


    答え
    3.46 -10.01 79.75 824.66
    従来型機械学習:データの組:100組、繰り返し数:100回

    View full-size slide

  38. 38
    従来型機械学習:データの組:一万組、繰り返し数:100回
    何番目の数字を
    何倍するか?
    予測


    答え
    -1.89 11.06 95.15 997.81

    View full-size slide

  39. 39
    従来型機械学習:データの組:一万組、繰り返し数:200回
    何番目の数字を
    何倍するか?
    予測


    答え
    1.00 9.99 100.00 1000.00

    View full-size slide

  40. 40
    つまり....
    従来型のAI
    従来型のAI(ちゃんと理由がわかっている=連立
    一次方程式)と同じ性能を従来型の機械学習
    従来型の機械学習(数
    字と倍率を適当に選んで合うまで繰り返す)でも
    出せるが「データと正解の数」が100倍必要。
    当然、計算時間もメモリーも膨大に必要。

    View full-size slide

  41. 41
    (最新の)機械学習の方法=深層学習
    深層学習
    「100個の数字の内の何個かをそれぞれ何倍かし
    て答えを作っている」
    が正しくないと従来型は正解できない。

    例えば、本当は
    「100個の数字の内の何個かをそれぞれ二乗して
    二乗して
    から
    から何倍かして答えを作っている」
    が本当の答だったらいくら頑張っても正解不可能。

    View full-size slide

  42. 42
    →人間が基準を決めない方法ならこれが可能。
    →それが深層学習
    深層学習。画像の中の物体認識も、
    機械翻訳も、囲碁・将棋・チェスの汎用対戦プロ
    グラムも、全部この深層学習を使っている。
    →今回の問題の場合、「データと答えの組」が
    10万個あればほぼ正解できた。

    View full-size slide

  43. 43
    ´104 予測


    答え
    深層学習
    深層学習:データの組:十万組、繰り返し数:十万回


    繰り返し数
    7万回
    最終誤差:3%
    最終誤差:3%

    View full-size slide

  44. 44
    なんで急に最近、できるようになったのか?
    昔は「十分なデータの数」が準備できなかった。
    100個の数字から正解を当てる、という場合も、
    解法既知(連立一次方程式)従来のAI:100組
    ルール(数字を選んで何倍化して足す)を与え
    た機械学習:一万組
    ルールを与えない機械学習:十万組
    →計算機が高速化してこんな数でも扱えるよう
    になった。

    View full-size slide

  45. 45
    AI(機械学習)の発展・普及で起きること
    AI(機械学習)の発展・普及で起きること
    事例1:自動運転での事故
    事例1:自動運転での事故
    あなたのかわいい4歳のお孫さんが自動運転車に
    轢き殺される。調査の結果、「4才の子供が赤い服
    を来て前方32度から近づいた場合人間と認識で
    きない」という非常にまれな事例(3%の誤差)の
    せいと解る(100%再現性あり)。
    「この度はご愁傷さまです。ですが、誤差はゼロに
    はできません。自動運転車の導入で死亡事故は半
    減しています。お孫さんの犠牲は不可抗力でした」
    → 論理的には正しい。しかし、納得できるか?

    View full-size slide

  46. 46
    事例2:ガン保険加入拒否
    事例2:ガン保険加入拒否
    あなたのお父さんががん保険に加入しようとしたと
    ころ「AIによる検査の結果、遺伝子と生活習慣から
    がんになる可能性が高いので加入はお断りします」
    予想通り癌になる。
    「よい治療がありますが、保険が効かないので高額
    です」
    がん保険に入れなかった父親は死亡。
    →高リスクの被保険者を排除するのは保険の経営
    的には合理的で保険料も下がるので一般加入者に
    も大きな利益なる。でも、納得できる?

    View full-size slide

  47. 47
    これからのAI(機械学習)の方向性1:創造性
    これからのAI(機械学習)の方向性1:創造性
    ○PAINTSCHAINER(線画の着色)
    https://paintschainer.preferred.tech/
    線画 AI 人間

    View full-size slide

  48. 49
    ○アニメ風の女の子の顔を描く
    https://make.girls.moe/#/
    https://makegirlsmoe.github.io/assets/
    pdf/technical_report.pdf

    View full-size slide

  49. 50
    やり方:
    ①「画像(データ)」が「顔かどうか(答え)」を深層学習。
    ②乱数を入れると画像を作るソフトを準備。
    ③②のソフトが①で「顔」を判断される画像をたくさん作る
    ようにチューニング。
    これだけで「顔画像生成ソフト」が作れる。

    View full-size slide

  50. 51
    https://datagrid.co.jp/news0.html
    同じ技術でアイドルの画像を作成

    View full-size slide

  51. 52
    これからのAI(機械学習)の方向性2:汎用性
    これからのAI(機械学習)の方向性2:汎用性
    汎用人工知能
    (AGI: artificial general intelligence)
    今のAI(機械学習)はタスクごとに学習が必要。
    AlphaZeroで機械翻訳をしたりはできない。
    これをタスクによらずになんでも学習することがで
    きる枠組みが欲しい。
    → 実現性の見込みはまだ立っていない。

    View full-size slide

  52. 53
    まとめ
    ○AI(機械学習
    機械学習)が急に進歩したように見えるのは
    「膨大なデータを使ってとにかく成功するまで延々と試す」
    がインターネットと計算機の進歩で可能になったから。
    ○なので「膨大なデータ
    膨大なデータ」が集められないものには無力。
    例:
     「買い物」
      :何万回も実空間で失敗できない
     「人生で幸せになる方法」
      :人生で何万回も不幸になれない
    ○汎用AIの実現は目処さえ立っていない。

    View full-size slide

  53. 54
    本日のプレゼン・講演ビデオを以下のURLにおいておきます。
    配布資料は白黒ですが下記URLからはカラー版が取得できます
    http://www.granular.com/gakujutsu/index.html
    配布資料最終ページにも同じ情報があります。

    View full-size slide