Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI(人工知能)の過去・現在・未来―AIは人間を超えるのか―

Y-h. Taguchi
August 31, 2018

 AI(人工知能)の過去・現在・未来―AIは人間を超えるのか―

2018年度中央大学学術講演会
AI(人工知能)の過去・現在・未来
―AIは人間を超えるのか―

中央大学理工学部物理学科

田口善弘
宮崎支部・香川支部
香川支部講演
https://youtu.be/ht2TqZgFLkQ
宮崎支部講演
https://youtu.be/ZPqEGnyPrPg

Y-h. Taguchi

August 31, 2018
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. 1 AI(人工知能)の過去・現在・未来 ―AIは人間を超えるのか― 中央大学理工学部物理学科 田口善弘

  2. 2 AIをめぐる最近の話題..... グーグルの完全無人タクシー 完全無人タクシー、ついに運行を開始 「このタクシーはアルファベット(グーグル)傘下のウェイモ (Waymo)が保有する(アリゾナ州フェニックス郊外)」

  3. 3 基礎研究に150億ドル投資 アリババの「中国式AI」は世界を席巻するのか?

  4. 4 アリババはすでに人工知能(AI)と機械学習 機械学習を 使って製品開発。 例: ・サプライチェーンの最適化 ・ユーザーに個別化した推奨の表示 ・アマゾン・エコー(Amazon Echo)に似た家庭用 機器である「Tモール・ジーニー(Tmall

    Genie)
  5. 5 資金投入について 資金投入について TencentとBaiduもAI研究に巨額の資金を投入 (テンセントとバイドゥは中国のテクノロジー界の 超巨大企業)。 中国政府は、2030年までに、約1500億ドル規模 のAI産業を構築しようと計画。 中国研究者に、他国より優位に立つよう要求。

  6. 6 一方で.... 「GoogleのAIのトップは曰く、人工知能という言葉 自体が間違っている、誇大宣伝を生む温床だ」 Googleエンジニアリング部門のSVP John Giannandrea が、TechCrunch Disrupt SFで、人工知能に関する優れた談話を

    語った。とくに彼は、人びとは汎用の人工知能に対して心配しすぎ だ、と考えている。
  7. 7 今日は、いわゆるAIとはどういうもので、 何ができて何ができなくて、将来我々の 生活にどういう影響があるかということ を説明してみたい。

  8. 8 AI(機械学習)ができること ◦画像から物体認識 https://pjreddie.com/darknet/yolo/ Y You o only l look

    o once (YOLO YOLO) 非常に高速な物体認識ソフト。 動画のリアルタイム認識が可能になった (動画は一秒間30コマ程度)。
  9. 9 言語の処理にも機械学習 機械学習は使われている。 例えば、機械翻訳の分野...。

  10. 10 ◦google翻訳(https://translate.google.co.jp) 戦時中は「敵」という言葉がひんぱんに使われた。 日常生活にも及び、英語が「敵性語」とされて、サイ ダーは噴出水、フライは洋天になった。学校では青い 目をした人形が、「敵性人形」と言われ焼かれた。 「ぜいたくは敵だ」の標語もあった。 (2018年4月21日「天声人語」冒頭) During the

    war the word "enemy" was used frequently. Even in daily life, English is regarded as "enemy word", cider gushed water, fly became Western-style. At school the doll who had blue eyes was said to be "enemy doll" and baked. There was also a slogan "Luxury is an enemy"
  11. 11 ◦AlphaZero 囲碁、将棋、チェスなどの1対1の盤面対戦ゲームの 汎用ソフト 汎用ソフト。 自己対決(一人将棋、ということ)だけで、ルール以 外、誰にも全く教えてもらわず......。 成果1.  学習時間3時間で最強チェスソフトに 勝つ強さに。

  12. 12 成果2.  学習時間8時間で既存最強囲碁ソフト (人間のチャンピオンに勝った)と100戦60勝 40敗と勝ち越し。

  13. 13 もはや誰かに教えてもらうのじゃなく自分で 勝ち方を発見できる!  しかも、ゲームルールに依らない汎用性 ゲームルールに依らない汎用性が ある....。 成果3. (学習時間不明)最強将棋ソフト (もちろん、羽生さんよりもはや強 いです)と100戦して90勝。

  14. 14 それでは、なんでAI(機械学習 機械学習)はこういう今 までは難しかったことが急にできるようになっ たのか、最近のAIと大昔やちょっと昔のAIは 何が違うのか、ということから説明したい。

  15. 15 いわゆる元々のAI: いわゆる元々のAI: 人間の思考をプログラミングで実現する。 例:将棋ソフト ①まず、ある盤面に対して可能な次の一手を  全部考えさせる。 ②次に、人間が「見込みのなさそうな手」を判断し、  候補から削除する。 ③残った候補手の次の一手を考える。②を繰り返す。

    ④なるべく先の手まで考えてから最善手を選んで  コンピュータが指す。
  16. 16 この様なやり方の利点: この様なやり方の利点: コンピュータが「なぜ、その手を指したか」を人間 は完全理解できる。 この様なやり方の欠点: この様なやり方の欠点: 考えなくてはいけない手の候補数があっという間 に膨大な数になる。 → 仮に一手当たり10通りの「良さそうな手」が

    あったとする。10手先(自分が5手、相手が5手)ま で考えると1010=100億通りの手を考えないとい けない。
  17. 17 1 1 2 3 4 5 6 7 8

    9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 10 100 1000 10000 1010=100億 ・・・・・・
  18. 18 コンピュータ:GHz=10億回/秒。 100億/10億=10秒 (もちろん、上記「一回」でできることは「1と0を 足す」みたいな演算なので「一回」で「一手の 良し悪し」を判断するのは到底無理である) 将棋:早指し=持ち時間切れたら30秒/一手 時間が全然間に合わない....。

  19. 19 そこで.... 機械学習 従来のAIと機械学習の違い。 機械学習  =「正解」をたくさん持ってきて学習する。 コンピュータ将棋:Bonanzaの登場(2006年) 製作者は日本人の化学者 (将棋は素人)。

  20. 20 特徴: 特徴: ・過去の六万局の棋譜データを探索。 ・「現在の局面」に「似たもの」を探して次の手 を考える、をなるべく先の手まで考える。 ・一番得点が高い手を指す。 ①手の良し悪しの判断は人間がしない 人間がしない ②「似たもの」の定義は人間がする。

    人間がする。  →従来AI型の将棋ソフトにバカ勝ちした。
  21. 21 人間が考えるよりデータに学ぶほうが良い 場合がある! (過去の棋譜はプロ棋士のものなので「良 い手=正解」が多いと期待できた) → しかし、「何が似ているか」は人間が考 人間が考 えていた。 えていた。 → 最新のAI=機械学習では「何が似てい

    るか」もコンピュータが決めている。 コンピュータが決めている。
  22. 22 ①適当に「似ている」 という基準を作る。 ②「似ている」という基準を ランダムにちょっと変更 対戦 勝 負 またちょっと変える ↓

    対局させる ↓ 良かった方を採用 十分強くなるまで 「似ている」の基準 を更新し続ける 過去の棋譜
  23. 23 こうやって「似ている」という 基準を「より強くなる」ように 自動的に変えることで人間 人間 が考えなくて良くする が考えなくて良くする。 同じ発想でいろんなことが可能になる。

  24. 24 画像からの物体認識の場合 人物 学習 人物

  25. 25 機械翻訳 This is a pen. これはペンです 学習 This is

    a pencil. これは鉛筆です
  26. 26 AlphaZero:自己対戦 “Mastering the game of Go without human knowledge”

    Nature volume 550, pages 354–359 (19 October 2017) 更に進んで「過去のデータ」さえ用いない......。 →「過去の棋譜」は自己対戦 自己対戦で作る
  27. 27 +「似ていること」の基準A セット1:ランダム作成 棋譜A +「似ていること」の基準B セット2:ランダム作成 棋譜B 自己対戦⇕ 自己対戦⇕ +「似ていること」の基準B’

    セット3:セット2をちょっと変えて作成 棋譜B’ ⇑棋譜Bからちょっと変更 ⇑「似ていること」の基準B からちょっと変更 自己対戦⇕ 自己対戦⇕
  28. 28 セット(旧) セット(新) 作成 対戦 セット(新)勝利! セット(旧)→消去 セット(新)→セット(旧) YES YES

    NO NO セット(新)→消去 これを十分強くなるまでひたすら繰り返す これを十分強くなるまでひたすら繰り返す 棋譜+「似ている」のルール 過去の棋譜不要!
  29. 29 最近、AIと呼ばれている機械学習がなぜ今までは なぜ今までは できなかったことができていろんなことが可能に できなかったことができていろんなことが可能に なったのか なったのかの基本は 「データから何かを出す(画像の中の物体の認識、 日本語を英語に翻訳する、将棋・囲碁・チェスで勝 つ)は、たくさんの

    データ ⇔ 正解 の組から「自動的に」学習する方が人間が考える 人間が考える よりも高性能がでる よりも高性能がでる」 という事実の発見にある。
  30. 30 …..が、これではいくらなんでも具体的 なことがわからないのですごく簡単な 例で「機械学習 機械学習」を体験する。

  31. 31 3 9 3 2 2 7 5 3 1

    9 5 9 5 8 4 5 2 10 5 7 7 9 1 7 7 1 3 4 5 7 2 8 6 1 2 5 1 5 1 2 4 8 7 2 1 10 4 7 4 7 5 6 9 4 6 4 10 4 2 5 10 10 3 7 10 8 7 6 10 6 6 3 7 9 4 10 10 7 7 9 10 10 5 9 5 9 9 1010 10 10 9 2 6 5 8 9 1 8 1 2393 2393 左の100個の数 字から右の4桁 が作られている。 どういうルールで しょう? 4番目の数字の1000倍 +3番目の数字の100倍 +2番めの数字の10倍 +1番目の数字 データ 答え データと答えの組から学習してデータが与えられ たら答えを作れるようになれるか?
  32. 32 「100個の数字の内の何個かをそれぞれ何倍 かして答えを作っているが、それは何番目の数 字でそれぞれ何倍にしているのか?」 という問題なら、「データと答えの組」が100個 あれば 連立一次方程式 の方法で解ける。

  33. 33 1 10 100 1000 予測 正 解 何番目の数字を 何倍するか?

    連立一次方程式 答え
  34. 34 しかし、機械学習はその方法を知 らなくてもこの問題を解ける (そして、解法がわからない問題 を強引に解くことができるのが機 械学習の方法)。

  35. 35 (従来型の)機械学習の方法 (従来型の)機械学習の方法 「適当な数字に適当な数をかけて足す」と仮定 (例えば、1,5,7,9番目の数字を6倍、8倍、9倍、 2倍して足す) ↓ 多数の「データと答えの組」に試す。 ↓ 当然、全然合わない。

    ↓ 「仮定」をちょっと変えて試す。 ↓ もし、一致度が上がったら採用。 ダメだったら他の仮定を試す。
  36. 36 →こんな稚拙なやり方でもたくさんの組 (例えば1万組)と長い計算時間があれ ば答えに達することが可能。 →これだとまだ「何がいいか」を人間が 仮定しているレベル。

  37. 37 何番目の数字を 何倍するか? 予測 正 解 答え 3.46 -10.01 79.75

    824.66 従来型機械学習:データの組:100組、繰り返し数:100回
  38. 38 従来型機械学習:データの組:一万組、繰り返し数:100回 何番目の数字を 何倍するか? 予測 正 解 答え -1.89 11.06

    95.15 997.81
  39. 39 従来型機械学習:データの組:一万組、繰り返し数:200回 何番目の数字を 何倍するか? 予測 正 解 答え 1.00 9.99

    100.00 1000.00
  40. 40 つまり.... 従来型のAI 従来型のAI(ちゃんと理由がわかっている=連立 一次方程式)と同じ性能を従来型の機械学習 従来型の機械学習(数 字と倍率を適当に選んで合うまで繰り返す)でも 出せるが「データと正解の数」が100倍必要。 当然、計算時間もメモリーも膨大に必要。

  41. 41 (最新の)機械学習の方法=深層学習 深層学習 「100個の数字の内の何個かをそれぞれ何倍かし て答えを作っている」 が正しくないと従来型は正解できない。 ↓ 例えば、本当は 「100個の数字の内の何個かをそれぞれ二乗して 二乗して

    から から何倍かして答えを作っている」 が本当の答だったらいくら頑張っても正解不可能。
  42. 42 →人間が基準を決めない方法ならこれが可能。 →それが深層学習 深層学習。画像の中の物体認識も、 機械翻訳も、囲碁・将棋・チェスの汎用対戦プロ グラムも、全部この深層学習を使っている。 →今回の問題の場合、「データと答えの組」が 10万個あればほぼ正解できた。

  43. 43 ´104 予測 正 解 答え 深層学習 深層学習:データの組:十万組、繰り返し数:十万回 誤 差

    繰り返し数 7万回 最終誤差:3% 最終誤差:3%
  44. 44 なんで急に最近、できるようになったのか? 昔は「十分なデータの数」が準備できなかった。 100個の数字から正解を当てる、という場合も、 解法既知(連立一次方程式)従来のAI:100組 ルール(数字を選んで何倍化して足す)を与え た機械学習:一万組 ルールを与えない機械学習:十万組 →計算機が高速化してこんな数でも扱えるよう になった。

  45. 45 AI(機械学習)の発展・普及で起きること AI(機械学習)の発展・普及で起きること 事例1:自動運転での事故 事例1:自動運転での事故 あなたのかわいい4歳のお孫さんが自動運転車に 轢き殺される。調査の結果、「4才の子供が赤い服 を来て前方32度から近づいた場合人間と認識で きない」という非常にまれな事例(3%の誤差)の せいと解る(100%再現性あり)。

    「この度はご愁傷さまです。ですが、誤差はゼロに はできません。自動運転車の導入で死亡事故は半 減しています。お孫さんの犠牲は不可抗力でした」 → 論理的には正しい。しかし、納得できるか?
  46. 46 事例2:ガン保険加入拒否 事例2:ガン保険加入拒否 あなたのお父さんががん保険に加入しようとしたと ころ「AIによる検査の結果、遺伝子と生活習慣から がんになる可能性が高いので加入はお断りします」 予想通り癌になる。 「よい治療がありますが、保険が効かないので高額 です」 がん保険に入れなかった父親は死亡。

    →高リスクの被保険者を排除するのは保険の経営 的には合理的で保険料も下がるので一般加入者に も大きな利益なる。でも、納得できる?
  47. 47 これからのAI(機械学習)の方向性1:創造性 これからのAI(機械学習)の方向性1:創造性 ◦PAINTSCHAINER(線画の着色) https://paintschainer.preferred.tech/ 線画 AI 人間

  48. 49 ◦アニメ風の女の子の顔を描く https://make.girls.moe/#/ https://makegirlsmoe.github.io/assets/ pdf/technical_report.pdf

  49. 50 やり方: ①「画像(データ)」が「顔かどうか(答え)」を深層学習。 ②乱数を入れると画像を作るソフトを準備。 ③②のソフトが①で「顔」を判断される画像をたくさん作る ようにチューニング。 これだけで「顔画像生成ソフト」が作れる。

  50. 51 https://datagrid.co.jp/news0.html 同じ技術でアイドルの画像を作成

  51. 52 これからのAI(機械学習)の方向性2:汎用性 これからのAI(機械学習)の方向性2:汎用性 汎用人工知能 (AGI: artificial general intelligence) 今のAI(機械学習)はタスクごとに学習が必要。 AlphaZeroで機械翻訳をしたりはできない。

    これをタスクによらずになんでも学習することがで きる枠組みが欲しい。 → 実現性の見込みはまだ立っていない。
  52. 53 まとめ ◦AI(機械学習 機械学習)が急に進歩したように見えるのは 「膨大なデータを使ってとにかく成功するまで延々と試す」 がインターネットと計算機の進歩で可能になったから。 ◦なので「膨大なデータ 膨大なデータ」が集められないものには無力。 例:  「買い物」

      :何万回も実空間で失敗できない  「人生で幸せになる方法」   :人生で何万回も不幸になれない ◦汎用AIの実現は目処さえ立っていない。
  53. 54 本日のプレゼン・講演ビデオを以下のURLにおいておきます。 配布資料は白黒ですが下記URLからはカラー版が取得できます http://www.granular.com/gakujutsu/index.html 配布資料最終ページにも同じ情報があります。