Slide 1

Slide 1 text

1
  Confidential © TDAI Lab All right reserved. 
 IJCAI2021から読み解く
 第4世代AIの研究開発
 人工知能学会セミナー
 2021年11月1日
 
 株式会社TDAI Lab


Slide 2

Slide 2 text

2
  Confidential © TDAI Lab All right reserved. 
 自己紹介
 経歴 2016年 株式会社TDAI Lab創業 (代表取締役社長) 2018年 東京大学大学院工学系研究科 修士課程修了 2021年 東京大学大学院工学系研究科 博士課程修了 興味領域 Fairness, Unbiased Learning to Rank, Recommendation 特技:競技ダンス 2014年 東京大学総長賞受賞 2015年 全日本学生競技ダンス選手権 優勝 2020年 芸能人格付けチェック出演 ~2021年 全日本準強化指定選手 著書 「世界一カンタンで実戦的な文系のための人工知能の教科書」 福馬 智生 Tomoki Fukuma @fukuma_tomoki

Slide 3

Slide 3 text

3
  Confidential © TDAI Lab All right reserved. 
 本資料の目的・留意事項
 【想定聴講者 】 1. 近年のAI研究トレンドのざっくりした傾向を掴みたい方 2. 機械学習・深層学習にある程度の予備知識がある方 3. 当カンファレンスについての一参加者の見解を、興味を持って聴講くださる方 【 留意事項 】  本発表資料はできる限り誤解のないように努めておりますが、著者自身の仮説や想定の誤りにより、内 容の一部に正確でない表現を含むことがあるかもしれない点、ご容赦ください。

Slide 4

Slide 4 text

4
  Confidential © TDAI Lab All right reserved. 
 目次 ● AI研究開発の潮流 ● 第4世代AIとは ● 仮説推論(アブダクション)に関する研究 ● 知識の表現方法 ● まとめ

Slide 5

Slide 5 text

5
  Confidential © TDAI Lab All right reserved. 
 目次 ● AI研究開発の潮流 ● 第4世代AIとは ● 仮説推論(アブダクション)に関する研究 ● 知識の表現方法 ● まとめ

Slide 6

Slide 6 text

6
  Confidential © TDAI Lab All right reserved. 
 AI研究開発の潮流

Slide 7

Slide 7 text

7
  Confidential © TDAI Lab All right reserved. 
 AI研究開発の潮流

Slide 8

Slide 8 text

8
  Confidential © TDAI Lab All right reserved. 
 【潮流2】今のAI研究者は何を目指して研究している? 【問題点1】AIのブラックボックス問題(説明責任) 【問題点2】AIのバイアス問題(公平性) 【問題点3】AIの脆弱性問題(堅牢性) 【問題点4】AIの品質保証問題(透明性) 【問題点5】AIによるフェイク問題 社会応用を進める上での信頼される AIの構築

Slide 9

Slide 9 text

9
  Confidential © TDAI Lab All right reserved. 
 AI研究開発の潮流 今日の主題

Slide 10

Slide 10 text

10
  Confidential © TDAI Lab All right reserved. 
 【潮流1】今のAI研究者は何を目指して研究している? 【問題点1】学習に大量の教師データや計算資源が必要 【問題点2】学習範囲外の状況に弱く、実世界状況への臨機応変な対応ができない 【問題点3】パターン処理は強いが、意味理解・説明等の高次処理はできていない

Slide 11

Slide 11 text

11
  Confidential © TDAI Lab All right reserved. 
 【潮流1】今のAI研究者は何を目指して研究している? 【問題点1】学習に大量の教師データや計算資源が必要 OpenAI:Dota2で世界チャンピオンに勝てるように なるまでに、45,000年分学習 Allen AI研究所:「アリスト」は、8年生レベル(日本の中2)の多肢 選択式の科学問題に答えるために、 300ギガバイトの科学論文と 知識グラフを利用 OpenAI : Transformerの性能には、計算時間・データサイズ・パラメー タ数のべき乗則に支配される

Slide 12

Slide 12 text

12
  Confidential © TDAI Lab All right reserved. 
 【潮流1】今のAI研究者は何を目指して研究している? 【問題点2】学習範囲外の状況に弱く、実世界状況への臨機応変な対応ができない https://arxiv.org/abs/1904.08653

Slide 13

Slide 13 text

13
  Confidential © TDAI Lab All right reserved. 
 【潮流1】今のAI研究者は何を目指して研究している? 【問題点3】パターン処理は強いが、意味理解・説明等の高次処理はできていない https://www.forbes.com/sites/robtoews/2020/07/19/gpt-3-is-amazingand-overhyped/?sh=338645581b1c

Slide 14

Slide 14 text

14
  Confidential © TDAI Lab All right reserved. 
 目次 ● AI研究開発の潮流 ● 第4世代AIとは ● 仮説推論(アブダクション)に関する研究 ● 知識と経験の違いとは? ● まとめ

Slide 15

Slide 15 text

15
  Confidential © TDAI Lab All right reserved. 
 第4世代AI (システム2.0)について ● 行動経済学で有名なDaniel Kahnemanは、著書「ファスト&スロー」において、 人間の知能には2つの側面があるとし、反応の速い即応的知能をシステム1.0、それに比べると反 応が遅い熟考的知能をシステム2.0と呼んだ ● 現在の深層学習はシステム1.0に相当し、将来の方向性はシステム2.0の深層学習という講演の メッセージ IJCAI 2021 Invited Talk Yoshua Bengio “System 2 Deep Learning: Higher-Level Cognition, Agency, Out-of-Distribution Generalization and Causality”

Slide 16

Slide 16 text

16
  Confidential © TDAI Lab All right reserved. 
 第4世代AI (システム2.0)について

Slide 17

Slide 17 text

17
  Confidential © TDAI Lab All right reserved. 
 システム1.0について ● Bengio :「システム1.0とは、人間が直感的、無意識的に行っている、言葉では説明できないような こと、行動の場合は習慣的に行っていることです。これは現在の深層学習が得意とするところで す。」 ● Ng : 「一般的な人が1秒以下の思考で精神的なタスクをこなせるなら、現在または近い将来、AIを 使ってそれを自動化することができるだろう」

Slide 18

Slide 18 text

18
  Confidential © TDAI Lab All right reserved. 
 システム2.0について ● 既存システム1.0に知識やルールを与え、状況や文脈(コンテキスト)に応じてそれらを組み 合わせて推論するような演繹型の仕組み 1 即応的AI (パターン処理) ● 現在のデータからボトムアップにルールやモデルを構築する帰納型の仕組み 2 熟考的AI (パターン処理と知識・記号推論の融合 ) ● 教師データが大量になくとも演繹によって補う(問題点1への対処) ● 学習範囲外のケースに対しても演繹によって対応(問題点2への対処) ● 意味理解・説明も演繹面から強化(問題点3への対処)

Slide 19

Slide 19 text

19
  Confidential © TDAI Lab All right reserved. 
 知覚と推論のギャップを埋める必要性 System 1.0 End-to-End System 2.0 知覚 推論 System 1.0 知識 環境 決定

Slide 20

Slide 20 text

20
  Confidential © TDAI Lab All right reserved. 
 目次 ● AI研究開発の潮流 ● 第4世代AIとは ● 仮説推論(アブダクション)に関する研究 ● 知識と経験の違いとは? ● まとめ

Slide 21

Slide 21 text

21
  Confidential © TDAI Lab All right reserved. 
 ピックアップ書誌情報 1. Abductive Learning with Ground Knowledge Base L.-W. Cai, W.-Z. Dai Y.-X. Huang, Y.-F. Li, S. H. Muggleton and Y. Jiang Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI’21) 2. Abductive Knowledge Induction from Raw Data W.-Z. Dai and S. H. Muggleton, Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI’21) 3. Semi-Supervised Abductive Learning and Its Application to Theft Judicial Sentencing, Y.-X. Huang, W.-Z. Dai, J. Yang, L.-W. Cai, S. Cheng, R. Huang, Y.-F. Li and Z.-H. Zhou, Proceedings of 20th IEEE International Conference on Data Mining (ICDM’20)

Slide 22

Slide 22 text

22
  Confidential © TDAI Lab All right reserved. 
 仮説推論(アブダクション)の位置付け System 1.0 End-to-End System 2.0 知覚 推論 System 1.0 知識 環境 決定

Slide 23

Slide 23 text

23
  Confidential © TDAI Lab All right reserved. 
 人間の帰納的問題解決 日本言語学オリンピックお試し問題集 https://iolingjapan.org/sample-problems/?s=09

Slide 24

Slide 24 text

24
  Confidential © TDAI Lab All right reserved. 
 Abductive Learningに関するフレームワーク ● Step1. ○ 入力(画像)をシンボル(数字)に 変換(Pseudo Label) ● Step2. ○ Step1で推測したPseudo Label を既知の仮説に基づき一部更 新する ○ (仮説もアップデート) ● Step3. ○ 更新したPseudo Labelを教師 データにして再学習

Slide 25

Slide 25 text

25
  Confidential © TDAI Lab All right reserved. 
 Abductive Learningに関するフレームワーク ● Step1. ○ 入力(画像)をシンボル(数字)に 変換(Pseudo Label) ● Step2. ○ Step1で推測したPseudo Label を既知の仮説に基づき一部更 新する ○ (仮説もアップデート) ● Step3. ○ 更新したPseudo Labelを教師 データにして再学習

Slide 26

Slide 26 text

26
  Confidential © TDAI Lab All right reserved. 
 Abductive Learningに関するフレームワーク ● Step1. ○ 入力(画像)をシンボル(数字)に 変換(Pseudo Label) ● Step2. ○ Step1で推測したPseudo Label を既知の仮説に基づき一部更 新する ○ (仮説もアップデート) ● Step3. ○ 更新したPseudo Labelを教師 データにして再学習 一言で言うと: 自分が過去に出力した情報が、何かしらの背景知識 や仮説によって修正され、それをもとに再学習

Slide 27

Slide 27 text

27
  Confidential © TDAI Lab All right reserved. 
 例1. 知識として正解ラベルの集合 (Hand Written OCR) ● タスク: ○ 入力:区分けされていない1枚の画像 ○ 出力:単語予測 ● モデル:CRNN ● 事前知識:IAM Handwriting Databaseの全ラベル (出力すべき単語の集合が既知 ) ● 学習方法:Pseudo Labelと近いものを学習セットから抽出 し、置換し再学習 (半教師あり学習) 学習データの割合を変化した際の正解率 Abductive Learning with Ground Knowledge Base(IJCAI2021)

Slide 28

Slide 28 text

28
  Confidential © TDAI Lab All right reserved. 
 例2. 仮説が離散値の組み合わせ(OCR+ルール発見) ● タスク:画像認識+ルールの発見 ○ Perception:画像認識 𝑓 : Image ↦ {0,1,...,9} ■ 𝑧 = 𝑓(𝑥) = 𝑓([𝑖𝑚𝑔1,𝑖𝑚𝑔2,𝑖𝑚𝑔3]) = [7,3,5] ○ Reasoning:𝑧から出力𝑦を計算するロジックを推論 ● 𝜃:機械学習モデルのパラメータ ● 𝑧: 未知の疑似ラベル ● 𝐻: 一階述語論理 Abductive Knowledge Induction From Raw Data (IJCAI2021)

Slide 29

Slide 29 text

29
  Confidential © TDAI Lab All right reserved. 
 例2. 仮説が離散値の組み合わせ(OCR+ルール発見) ● Hを構成するルールBと入力系列が多くなるにつれ指数的に探索範囲が増大 ● 効率的な最適化手法が提案(詳細な最適化方法については原著を参照) Abductive Knowledge Induction From Raw Data (IJCAI2021)

Slide 30

Slide 30 text

30
  Confidential © TDAI Lab All right reserved. 
 例2. 仮説が離散値の組み合わせ(OCR+ルール発見) ● Hを構成するルールBと入力系列が多くなるにつれ指数的に探索範囲が増大 ● 効率的な最適化手法が提案(詳細な最適化方法については原著を参照) 膨大な探索空間 Abductive Knowledge Induction From Raw Data (IJCAI2021)

Slide 31

Slide 31 text

31
  Confidential © TDAI Lab All right reserved. 
 例2. 仮説が離散値の組み合わせ(OCR+ルール発見) ● Hを構成するルールBと入力系列が多くなるにつれ指数的に探索範囲が増大 ● 効率的な最適化手法が提案(詳細な最適化方法については原著を参照) ○ 仮説の構築と文字認識を交互に更新 ○ 探索範囲の枝刈り Abductive Knowledge Induction From Raw Data (IJCAI2021)

Slide 32

Slide 32 text

32
  Confidential © TDAI Lab All right reserved. 
 例3. 仮説に連続値θを含む (刑罰予測) ● タスク:裁判記録(テキスト)から刑罰 (罰金額など)を予測する。 ○ 中国・貴州省の窃盗に関する裁判記録 687件。 ○ 一部ラベル付きデータとラベルなしデータが利用可能 (半教師あり学習) ○ 補助データとして窃盗額・ジャンルラベル(自首や強盗)が利用可能 ● ナイーブな方法:BERT + finetuning ● 事前知識 ○ 窃盗額は刑罰の一つの基準 ○ 自首や強盗といった追加条件によって刑罰の重さが変わる ■ それらは文章中に書かれているが、明示的には取り出せない ○ またこれらがどのように最終結果に影響を与えるかは未知

Slide 33

Slide 33 text

33
  Confidential © TDAI Lab All right reserved. 
 例3. 仮説に連続値θを含む (刑罰予測) 最終的なイメージ図 上記数字のパラメータも最適化 対象である点について注意

Slide 34

Slide 34 text

34
  Confidential © TDAI Lab All right reserved. 
 例3. 仮説に連続値θを含む (刑罰予測) ● Step1 :BERTを用いてテキストからジャンルに対する多クラス分類を行う ● Step2:窃盗金額や予想クラスから刑罰を推定 (機械学習的パラメトリックモデル) ● Step3:推定したジャンルを(Pseudo Label)再度更新、刑罰予測器のパラメーターも更新

Slide 35

Slide 35 text

35
  Confidential © TDAI Lab All right reserved. 
 ここまでのまとめ ● 如何に仮説や知識をもとに知覚したデータから”推論”するか ● Abductive Learningという学習フレームワークの紹介 ● 知覚(データからシンボルへの変換)と仮説や知識との一貫性が最も高い組み合わせを探す同時 最適化問題 ● 半教師あり学習との関連性が高い ○ 省データ化 ○ モデルパラメータ削減

Slide 36

Slide 36 text

36
  Confidential © TDAI Lab All right reserved. 
 感想 ● 反復的に探索するところが面白い ● 人間も認知情報の更新と仮説再構築を交互に行っているのかもしれない(?) ● 多大な探索範囲から如何に解が見つけられるかに、人の考えるという時間が存在したり、ひらめき 力に個人差があるのかもしれない(?)

Slide 37

Slide 37 text

37
  Confidential © TDAI Lab All right reserved. 
 目次 ● AI研究開発の潮流 ● 第4世代AIとは ● 仮説推論(アブダクション)に関する研究 ● 知識の表現方法 ● まとめ

Slide 38

Slide 38 text

38
  Confidential © TDAI Lab All right reserved. 
 IJCAI2021における知識に関する講演 IJCAI 2021 Award for Research Excellence Ricard Sutton “The Increasing Role of Experience in AI” IJCAI 2021 Invited talk Michael Thielscher “Knowledge Representation for Systems with General Intelligence”

Slide 39

Slide 39 text

39
  Confidential © TDAI Lab All right reserved. 
 IJCAI2021における知識に関する講演 IJCAI 2021 Award for Research Excellence Ricard Sutton “The Increasing Role of Experience in AI” IJCAI 2021 Invited talk Michael Thielscher “Knowledge Representation for Systems with General Intelligence”

Slide 40

Slide 40 text

40
  Confidential © TDAI Lab All right reserved. 
 General Game Playing ● 2005年AAAI以降続くコンペティション ● 未知のゲームをプレイするエージェントの設計を目標とするプロジェクト ○ 新たなゲームのルールを理解する ○ 人の介入なしにゲームを効率的にプレイする方法を学習する ● ゲームのルールをシステムに理解させる必要がある

Slide 41

Slide 41 text

41
  Confidential © TDAI Lab All right reserved. 
 Game Description Language(Love et al. 2008), ● GGPにおいてゲームを記述するための論理型言語 ● ○×ゲーム(三目並べ)から将棋まであらゆるゲームを定義することができる

Slide 42

Slide 42 text

42
  Confidential © TDAI Lab All right reserved. 
 Deep Reinforcement Learning for General Game Playing ● ゲームのGDL記述を、Propositional Networkに変換(Schkufza, Love, & Genesereth, Al'08) ○ GDLをグラフで表現 ● DNNにゲーム状態を入力 ○ 報酬と行動確率を出力 ● AlphaZeroと同様にself-playで学習 Goldwaser & M.T., AAAl'20

Slide 43

Slide 43 text

43
  Confidential © TDAI Lab All right reserved. 
 個人的感想 ● 未知のゲームでも上手くプレイできるエージェントを作る General Game Playing(GGP)と いうタスクを紹介 ● 紹介例: ○ (知識の表現)Game Description Language ○ (知識の入力)GDLから変換したPropositional Network ○ (知識の学習)Self-Play

Slide 44

Slide 44 text

44
  Confidential © TDAI Lab All right reserved. 
 IJCAI2021における知識に関する講演 IJCAI 2021 Award for Research Excellence Ricard Sutton “The Increasing Role of Experience in AI” IJCAI 2021 Invited talk Michael Thielscher “Knowledge Representation for Systems with General Intelligence”

Slide 45

Slide 45 text

45
  Confidential © TDAI Lab All right reserved. 
 Sutton's The Bitter Lesson ● 2019年3月にSutton氏が公開した記事 ● 70年にわたるAI研究から読み取れる最大の教訓は、計算機を活用した汎用的な手法が最 終的に最も効果的であるということ ● チェスや碁・音声認識・画像認識など、人間のドメイン知識を入れた手法はことごとく統計的 手法に置き換えられてきた http://www.incompleteideas.net/IncIdeas/BitterLesson.html

Slide 46

Slide 46 text

46
  Confidential © TDAI Lab All right reserved. 
 知識とは経験的である ● 世界はブラックボックスであり、I/Oによってのみ知ることができる ● 人間も経験からのみによって学習している ● エージェントへの知識も経験のみから学習させるべき ○ 知識も同様にドメイン知識を使ってグラフなどを構築するものではない? ○ 経験から正しく予測できることは知識といって良い? ■ President of the US is 〇〇. ■ The capital of France is 〇〇.

Slide 47

Slide 47 text

47
  Confidential © TDAI Lab All right reserved. 
 知識と経験のギャップ ● しかし知識には経験から得られるものに大きながギャップがある ● 如何にそれらのギャップを経験の観点から埋めるかが重要 ● また数学的理論や定理は、知識ではなく自然法則のため切り離す必要性がある可能性 ● ジョー・バイデンはアメリカ大統領 ● エッフェル塔はパリにある ● オレゴンはカリフォルニアの北 ● あそこのカレー屋さんは美味しい ● 私の足は痛いです ● 次のピクセルは、青色になります

Slide 48

Slide 48 text

48
  Confidential © TDAI Lab All right reserved. 
 目次 ● AI研究開発の潮流 ● 第4世代AIとは ● 仮説推論(アブダクション)に関する研究 ● 知識の表現方法? ● まとめ

Slide 49

Slide 49 text

49
  Confidential © TDAI Lab All right reserved. 
 結論 ● AI研究は第4世代へ ○ 既存システム1.0に知識やルールを与え、状況や文脈(コンテキスト)に応じてそれらを組 み合わせて推論するような演繹型の仕組み ● 知覚と仮説を同時に最適化していくフレームワークの紹介 ○ 人間が”考える”といった行為に似ていると感じた ● 仮説や知識をいかに表現するかが課題 ○ 短期的には以下が焦点 ■ (表現) 知識グラフなど人間と機械の共通の言語 ■ (蒸留 )それらを如何にデータから抽出するか ■ (入力) システムへの入力 ■ (学習) それらをつかった効率的な学習 ○ 将来的に知識はどこまで経験から学ばせるべきかどうかの議論

Slide 50

Slide 50 text

50
  Confidential © TDAI Lab All right reserved. 
 追記:知識を如何にデータから抽出する Symbolic Knowledge Distillation: from General Language Models to Commonsense Models Peter West, Chandra Bhagavatula, Jack Hessel, Jena D. Hwang, Liwei Jiang, Ronan Le Bras, Ximing Lu, Sean Welleck, Yejin Choi https://arxiv.org/abs/2110.07178 https://twitter.com/AkiraTOSEI/status/1455732603491737604?s=20

Slide 51

Slide 51 text

51
  Confidential © TDAI Lab All right reserved. 
 質疑応答