Upgrade to Pro — share decks privately, control downloads, hide ads and more …

シリーズAI入門:6. 第2次AIブーム 知識ベース

FSCjJh3NeB
February 03, 2021

シリーズAI入門:6. 第2次AIブーム 知識ベース

第2次AIブーム,特に知識ベースについて眺めます。

FSCjJh3NeB

February 03, 2021
Tweet

More Decks by FSCjJh3NeB

Other Decks in Education

Transcript

  1. 実用上… n たとえば,困りごとについて答えを教えてくれる u “1mol って何個だっけ?” p 6.02x1023です。アボガドロ数とも呼ばれます。 u ”今日って雨は降るの?”

    p 東京都のお天気は晴れ,最高気温9度,最低気温3度です。 3 Google検索 や Alexa みたいなことを 昔の人もやりたかった! まずは対話できる仕組みの開発からスタート
  2. chat bot n 対話のできる AI u テキストでの問い合わせに対して,テキストで 適切な答えを返してくれるようなもの u 初期のAIは

    人工無能 と揶揄されるタイプのおもちゃ p ELIZA (イライザ) • 人間にはセラピストとチャットしているという設定で使ってもらう • 基本的に相手の質問をオウム返しする • 人:彼氏に言われてここにきたの • AI:彼氏に言われてここにきたのですね • 人:彼氏にはいつも落ち込んでいると言われるの • AI:あなたがいつも落ち込んでいるとは残念です 4 相手の発言を 肯定も否定もせずに 繰り返す… というのは, 実は現実の カウンセリング でも用いられる 基礎テクニック! 意外と気に入る人もいて,実験後も使いたいという声があった
  3. バーナム効果 n 占いなどを信じさせるテクニックの一つ u 誰にでも当てはまりそうなことを,それっぽく言う u バーナムという興行師にちなんで名付けられた p 例えば偽の心理テストを行い,全員に以下の結果を示す •

    あなたは他人から好かれたい、賞賛してほしいと思っており、それ にかかわらず自己を批判する傾向にあります。 • また、あなたは弱みを持っているときでも、それを普段は克服する ことができます。 • あなたは使われず生かしきれていない才能をかなり持っています。 • 外見的には規律正しく自制的ですが、内心ではくよくよしたり不安 になる傾向があります。 • etc. p 多くの人が自分に当てはまっていて,正しい診断だと思う 5
  4. チューリング・テスト n AI が できたか どうかを判定するためのテスト n 別の場所にいる人間が,コンピュータを通じて やりとりし,相手が人間か否か判別できなければ AI

    ができた…と,判定する ? ※ アラン・チューリングは 1950年 にこのテストを論文にまとめている ENIAC は1946年ごろ,ダートマス会議は1956年 6 将来補足
  5. 知能とは:中国語の部屋 n 知的に見える=知的か? u 行動主義的には知的であるといってもいいかもしれない n 中国語の部屋 u 密室の中に,中国語が一切しゃべられない人がいる u

    スゴイ辞書があって,中国語のこの文字が来たら, この文字を返す.というのが一瞬で出てくる u 密室内の人はこの辞書を持っていて,中国語の質問に 答えてくれる p 意味はわかっていないが,とにかく辞書で対応する文字列を探し て返しているだけ u 外から見たら,中の人は中国語を理解している 7 将来補足
  6. expert system n 特定のドメイン知識を取り込んで, その分野の専門家のように振る舞えるシステム u ELIZA は セラピスト という触れ込みで,

    実際に 良いセラピスト だと信じた人もいたが, 現実には使用者の台詞をほとんどオウム返ししていた u expert system では実際の専門家の知識を取り込んで, 正しく専門家のように振る舞うことを目指す お医者さんっぽい格好をした そこらの一般人 = ELIZA 医大で勉強し,資格を持つ 本物のお医者さん=Expert System ※ ELIZAは固有名詞,expert system は一般名詞 8
  7. expert systemの例: MYCIN n 1970年代に開発されたexpert system n 血液中の細菌の種類を特定できる u 細菌退治に使う抗生物質に

    ***マイシン という 名前のものが多かったのでつけられた名前 u if-then ルールを記載しておくことで実現 p 一種の Yes – No クイズ • 培地は血液ですか? • グラム染色はネガティブですか? • 細菌の形状は棒状ですか? …といった質問に答えていくと候補を絞り込んでくれる 正解率60%,専門医の80%には劣るが, 一般の医師よりはよい成績をおさめた 9
  8. expert systemの流行と限界 n MYCINなどの成功により流行 u 様々な分野向けの expert system が作られることに n

    作成は意外と面倒なことがわかった… u Yes-No クイズ作成のに関わる様々なコスト p そもそも,知識を文字に起こすことが難しい • 自転車の乗り方を文章で説明する • リンゴがどのようなものかを文章で説明する p 必ずしも一貫しない知識間の整合性保守 • 専門家の間でも見解が分かれることもある • 研究の進展により,条件が変わることもある “常識” や “暗黙知” と呼ばれる言語化しにくい・できない知識の存在 11
  9. MYCIN その後 n 一般の医師よりも好成績だったにも関わらず, 流行のきっかけを作ったにも関わらず,お蔵入り u 理由のひとつは,専門知識以外がなかったから p 注射をするのは痛いので,できれば避けたい…というような, 人間ならあえて言わなくてもよい知識は当然無い

    p 関連しそうな知識を全部書く…となると, フレーム問題 といわれる課題にぶつかってしまう u 他にも,コンピュータの診断結果に基づいて治療… という行為に対する法・倫理的な大きな課題も p だれが,どう責任をとるのか? ← 自動運転の事故と同じ 12
  10. expert systemの流行と限界 n 探索と同様に時代背景に起因する部分も u expert system の流行は1960年代〜70年代 p 1979年時点で,HDDの容量が250MB

    p インターネットが一般に普及し始めるのは1990年代 u 今なら Wikipedia など,ネットの情報が使えるが… p コンピュータは大学に1台あるかどうか p ストレージも超高価で大量のデータは保存できない p データの打ち込みを,ゼロから行う必要… 13
  11. expert system から得られた知見 n むしろ,ガチの専門分野は楽 u 最先端の研究分野は,論文などの形で 知識が言語化・体系化され,整備されている p MYCIN

    がうまくいったのもこのあたりが理由 n 話題が汎用的なものになるほど困難 u 常識や暗黙知など,言語化されない知識を多数用いる p さらに状況依存性があり,ある状況では正しい行動が, ある状況では正しくない,ということもある • とても仲のよい友達から「バカだなぁ」と言われるのと, 通りすがりの人から「バカだなぁ」と言われるのでは意味が異なる どのようにすれば,うまく知識を抽出・記述できるのか? 15
  12. 意味ネットワーク n 概念と関係をグラフを用いて整理したもの u もともとは認知心理学における,長期記憶の構造モデル u 情報工学では,データベースにおけるER図 ※entity-relation や UML※Unified

    Markup Language ダイアグラムとも関連 生物 動物 哺乳類 猫 は虫類 植物 頭 胴体 is-a is-a is-a is-a is-a part-of part-of 脚部 足 part-of is-a 4 number 1 number part-of 継承 属性 矢印が向いている方が上位概念 16
  13. オントロジー 概念体系を記述するための方法論 n 大変だとはいえ,知識を書き下せれば, expert system でうまく行けそうな感触はある u じゃぁ,常識とかそういうのも全部書けば良いじゃん! という,体育会系アプローチ(私はこういう力押しは好きです。)

    u ただし,すでに見たとおり書き下すだけではなく, 知識の更新・保守の面の課題もあって,単純ではダメ n オントロジーの一般的な定義 u 概念化の明示的な仕様 p 対象とする世界の情報処理モデルを構築する人が,その世界をどのよう に “眺めたか”,言い換えるとその世界には “何が存在している” とみなし てモデルを構築したかを(共有を志向して)明示的にしたものであり, その結果得られた基本概念や概念間の関係を土台にしてモデルを記述で きる概念体系 (by 溝口理一郎) 19
  14. 標準・規格 n 人工物の設計に標準・規格は不可欠 u 言語も機械も,情報システムも独自ルールで作成は可能 p ex. • 「え」「w」「ぅ」の3文字だけの独自言語 •

    独自規格のネジで作成した工作機械 • 独自回路,言語&11進数計算の情報システム u 独自ルール では 他者とのやりとり が できない… おはよう! えwwwwぅえええ えええぅえええええ えええwwぅえ wwぅ! ルール(標準・規格)を定めることで,他者とのやりとりが実現 これにより,タスクを分業することなどが可能になる 21
  15. 標準・規格 n コンピュータ(≒工業製品)は規格の固まり u ソフトウェアには物理制約がないため, 特に設計における自由度が大きい u OSがハードウェアの差異を吸収することで, OS上で動くアプリの自由度を確保する p

    OSがアプリの自由度を規定すると考えても良い u アプリ間,OS間ではAPI(Application Programming Interface) という形でルールを規定 u ネットワークにおいてはプロトコル(Protocol)という 形でルールを規定 おはよう! おはよ〜 22
  16. 意味ネットワークとオントロジー n 先ほど出てきた意味ネットワークと, オントロジーは結局,同じものなのか違うのか? n こたえ: u オントロジーも,意味ネットワークを用いる u 意味ネットワークの書き方について,

    みんなで同じルールを守る…という制約がつく Aさんが「猫」についてまとめている間, Bさんは「犬」についてまとめて, あとで,2つをくっつける…というようなことも可能に オントロジーは,規約付きの意味ネットワーク! 23
  17. オントロジーの要素:is-a n 基本要素のうち,is-a, part-of は特に重要 n is-a = …である u

    “XXX は YYY である” という関係を示す p 人間 は 動物 である 人間 is-a 動物 p ソクラテス は 人間 である ソクラテス is-a 人間 u 上位・下位の関係性があり,推移律がなりたつ p 推移律: A is-a B,B is-a C → A is-a C ※ 可換則はないので入れ替えはダメ • 上の例だと, ソクラテス は 動物 である と言ってよい 人間 ソクラテス is-a 下位概念 上位概念 24
  18. オントロジーの要素:part-of n 全体と部分の関係を表す n part-of = …の一部 u “XXX は

    YYY の一部である” という関係を示す p 東京 は 日本 の一部である 東京 part-of 日本 p 日本 は 世界 の一部である 日本 part-of 世界 u 推移律がなりたつとは限らない p “とは限らない” なので,成り立つケースもある 私 腕 XX大学 私 XX大学 腕 part-of part-of part-of 25
  19. 意外と判断には迷う… n 人間 は 哺乳類 の一部 …も表現として正しい u 人間 is-a

    哺乳類 ? 人間 part-of 哺乳類 ? u 私 は 大学 に所属している…じゃぁ 私 part-of 大学 ? でもこれだと,私が大学の構成要素のような… n このあたりは,英語のニュアンスとのズレも u 仲間に加わる…は,英語だと Join (くっつく)だが, 日本語だと 混ざる(mix)だったりする u is-a, part-of も基本的には英語のイメージで考える Joint Mix 26
  20. オントロジーの要素:part-of n part-of いろいろ 森 木 part-of 夫婦 妻 part-of

    ケーキ ケーキの一部 part-of 花瓶 ケイ素 part-of 木が一つ失われても森は残る 妻がいなくなると夫婦も夫も消え, 残るのは,ただの女性と男性 ケーキの一部でもケーキではある ケイ素(土)成分がなくなると, 花瓶はその形を保てずなにも残らない 前掲の推移律が残らないケース含め,最低5種類は存在 27
  21. まとめ n 中期のAI研究では知識表現などに注目があった u 具体アプリ:MYCIN u 知識を書き下し,それに用いて振る舞う p 知識の書き下しが大変なことも判明… u

    書き下せればいけそうではあるので,書いてみることに p 意味ネットワーク,オントロジー p 近年では,ネットでみんなが知識を書き込んでくれるので, オントロジーの自動生成もそこそこ良い感じに (c.f. ワトソン) 31
  22. フレーム問題 n 問題に関連する情報の境界線(フレーム)を 定めることは実は非常に困難 n 「隣の部屋にあるリンゴをとってきて」 u 部屋とは?リンゴとは?とってくるとは? u その行為に,室温や湿度,明るさは関係ある?ない?

    u 部屋に入るのに障害物(壁やドア)は壊していい? u どうやったら壊せる?もしくは壊さず入るには? …などなどなどなど 33 人間は“なぜか”必要な情報だけをうまく取り出し, 行動をすることができる ※ やっかいなことに自身が動くと相対的に環境の見え方も変わるので,常に上記の問題が繰り返される.
  23. 初期フレーム問題 n 状況の記述には膨大な知識と状態の記述が必要 u n種類の状態に,m種類の行為があるとするなら, n × m 個の記述が必要になる p

    手の位置が (0,1,3) の時,(0,1,4)の時…・ p 親指を0.1度曲げる,伸ばす,「あ」という声を出す… u ある行為を記述しようとしたとき,その行為によって 変化する事柄と,変化しない事柄を明示的に記述・推論 するならば,その量は指数関数的に増大する 34 将来補足