第1次で明らかになった課題
n 限定された環境下では,
単純な探索でもそれなりに問題を解くことができる
n 少し複雑になってくると計算量の問題から,
うまくは機能しなくなってくる
u そもそも複雑な問題を扱えてこその知能なのでは?
n コンピューターが極めて高価な時代,
できるだけ実用上の問題を解きたい…!!!
2
Slide 3
Slide 3 text
実用上…
n たとえば,困りごとについて答えを教えてくれる
u “1mol って何個だっけ?”
p 6.02x1023です。アボガドロ数とも呼ばれます。
u ”今日って雨は降るの?”
p 東京都のお天気は晴れ,最高気温9度,最低気温3度です。
3
Google検索 や Alexa みたいなことを
昔の人もやりたかった!
まずは対話できる仕組みの開発からスタート
Slide 4
Slide 4 text
chat bot
n 対話のできる AI
u テキストでの問い合わせに対して,テキストで
適切な答えを返してくれるようなもの
u 初期のAIは 人工無能 と揶揄されるタイプのおもちゃ
p ELIZA (イライザ)
• 人間にはセラピストとチャットしているという設定で使ってもらう
• 基本的に相手の質問をオウム返しする
• 人:彼氏に言われてここにきたの
• AI:彼氏に言われてここにきたのですね
• 人:彼氏にはいつも落ち込んでいると言われるの
• AI:あなたがいつも落ち込んでいるとは残念です
4
相手の発言を 肯定も否定もせずに 繰り返す… というのは,
実は現実の カウンセリング でも用いられる 基礎テクニック!
意外と気に入る人もいて,実験後も使いたいという声があった
Slide 5
Slide 5 text
バーナム効果
n 占いなどを信じさせるテクニックの一つ
u 誰にでも当てはまりそうなことを,それっぽく言う
u バーナムという興行師にちなんで名付けられた
p 例えば偽の心理テストを行い,全員に以下の結果を示す
• あなたは他人から好かれたい、賞賛してほしいと思っており、それ
にかかわらず自己を批判する傾向にあります。
• また、あなたは弱みを持っているときでも、それを普段は克服する
ことができます。
• あなたは使われず生かしきれていない才能をかなり持っています。
• 外見的には規律正しく自制的ですが、内心ではくよくよしたり不安
になる傾向があります。
• etc.
p 多くの人が自分に当てはまっていて,正しい診断だと思う
5
Slide 6
Slide 6 text
チューリング・テスト
n AI が できたか どうかを判定するためのテスト
n 別の場所にいる人間が,コンピュータを通じて
やりとりし,相手が人間か否か判別できなければ
AI ができた…と,判定する
?
※ アラン・チューリングは 1950年 にこのテストを論文にまとめている
ENIAC は1946年ごろ,ダートマス会議は1956年
6
将来補足
Slide 7
Slide 7 text
知能とは:中国語の部屋
n 知的に見える=知的か?
u 行動主義的には知的であるといってもいいかもしれない
n 中国語の部屋
u 密室の中に,中国語が一切しゃべられない人がいる
u スゴイ辞書があって,中国語のこの文字が来たら,
この文字を返す.というのが一瞬で出てくる
u 密室内の人はこの辞書を持っていて,中国語の質問に
答えてくれる
p 意味はわかっていないが,とにかく辞書で対応する文字列を探し
て返しているだけ
u 外から見たら,中の人は中国語を理解している
7
将来補足
Slide 8
Slide 8 text
expert system
n 特定のドメイン知識を取り込んで,
その分野の専門家のように振る舞えるシステム
u ELIZA は セラピスト という触れ込みで,
実際に 良いセラピスト だと信じた人もいたが,
現実には使用者の台詞をほとんどオウム返ししていた
u expert system では実際の専門家の知識を取り込んで,
正しく専門家のように振る舞うことを目指す
お医者さんっぽい格好をした
そこらの一般人 = ELIZA
医大で勉強し,資格を持つ
本物のお医者さん=Expert System
※ ELIZAは固有名詞,expert system は一般名詞
8
Slide 9
Slide 9 text
expert systemの例: MYCIN
n 1970年代に開発されたexpert system
n 血液中の細菌の種類を特定できる
u 細菌退治に使う抗生物質に ***マイシン という
名前のものが多かったのでつけられた名前
u if-then ルールを記載しておくことで実現
p 一種の Yes – No クイズ
• 培地は血液ですか?
• グラム染色はネガティブですか?
• 細菌の形状は棒状ですか?
…といった質問に答えていくと候補を絞り込んでくれる
正解率60%,専門医の80%には劣るが,
一般の医師よりはよい成績をおさめた
9
Slide 10
Slide 10 text
expert systemの例: Akinator
n インターネットで気楽に遊べるシステム
u 特定の有名人を思い浮かべて,質問に答えると
最終的にその有名人が誰かを当ててくる
https://jp.akinator.com/game
ドメイン知識を移植していないので,厳密には expert system ではないが,
ロジック,手続きの面では expert system とほぼ同じものとみなせる
10
Slide 11
Slide 11 text
expert systemの流行と限界
n MYCINなどの成功により流行
u 様々な分野向けの expert system が作られることに
n 作成は意外と面倒なことがわかった…
u Yes-No クイズ作成のに関わる様々なコスト
p そもそも,知識を文字に起こすことが難しい
• 自転車の乗り方を文章で説明する
• リンゴがどのようなものかを文章で説明する
p 必ずしも一貫しない知識間の整合性保守
• 専門家の間でも見解が分かれることもある
• 研究の進展により,条件が変わることもある
“常識” や “暗黙知” と呼ばれる言語化しにくい・できない知識の存在
11
Slide 12
Slide 12 text
MYCIN その後
n 一般の医師よりも好成績だったにも関わらず,
流行のきっかけを作ったにも関わらず,お蔵入り
u 理由のひとつは,専門知識以外がなかったから
p 注射をするのは痛いので,できれば避けたい…というような,
人間ならあえて言わなくてもよい知識は当然無い
p 関連しそうな知識を全部書く…となると,
フレーム問題 といわれる課題にぶつかってしまう
u 他にも,コンピュータの診断結果に基づいて治療…
という行為に対する法・倫理的な大きな課題も
p だれが,どう責任をとるのか? ← 自動運転の事故と同じ
12
Slide 13
Slide 13 text
expert systemの流行と限界
n 探索と同様に時代背景に起因する部分も
u expert system の流行は1960年代〜70年代
p 1979年時点で,HDDの容量が250MB
p インターネットが一般に普及し始めるのは1990年代
u 今なら Wikipedia など,ネットの情報が使えるが…
p コンピュータは大学に1台あるかどうか
p ストレージも超高価で大量のデータは保存できない
p データの打ち込みを,ゼロから行う必要…
13
expert system から得られた知見
n むしろ,ガチの専門分野は楽
u 最先端の研究分野は,論文などの形で
知識が言語化・体系化され,整備されている
p MYCIN がうまくいったのもこのあたりが理由
n 話題が汎用的なものになるほど困難
u 常識や暗黙知など,言語化されない知識を多数用いる
p さらに状況依存性があり,ある状況では正しい行動が,
ある状況では正しくない,ということもある
• とても仲のよい友達から「バカだなぁ」と言われるのと,
通りすがりの人から「バカだなぁ」と言われるのでは意味が異なる
どのようにすれば,うまく知識を抽出・記述できるのか?
15
Slide 16
Slide 16 text
意味ネットワーク
n 概念と関係をグラフを用いて整理したもの
u もともとは認知心理学における,長期記憶の構造モデル
u 情報工学では,データベースにおけるER図 ※entity-relation
や
UML※Unified Markup Language
ダイアグラムとも関連
生物
動物
哺乳類
猫
は虫類
植物
頭
胴体
is-a
is-a
is-a
is-a
is-a
part-of
part-of 脚部
足
part-of
is-a
4
number
1
number
part-of
継承
属性
矢印が向いている方が上位概念
16
Slide 17
Slide 17 text
何かの相関図だと思えばOK
n 何かと何かの関係をグラフで示しただけ
u 矢印の方向や,種類に気をつければ簡単
ダウントン・アビー S3 相関図
出典:http://downtonabbey-tv.jp/sp/chart/chart_s3.html
17
Slide 18
Slide 18 text
何かの相関図だと思えばOK
n 何かと何かの関係をグラフで示しただけ
u 矢印の方向や,種類に気をつければ簡単
ドラマ “感染爆発” 相関図
出典:http://www.transformer.co.jp/m/outbreak/characters.php
18
Slide 19
Slide 19 text
オントロジー 概念体系を記述するための方法論
n 大変だとはいえ,知識を書き下せれば,
expert system でうまく行けそうな感触はある
u じゃぁ,常識とかそういうのも全部書けば良いじゃん!
という,体育会系アプローチ(私はこういう力押しは好きです。)
u ただし,すでに見たとおり書き下すだけではなく,
知識の更新・保守の面の課題もあって,単純ではダメ
n オントロジーの一般的な定義
u 概念化の明示的な仕様
p 対象とする世界の情報処理モデルを構築する人が,その世界をどのよう
に “眺めたか”,言い換えるとその世界には “何が存在している” とみなし
てモデルを構築したかを(共有を志向して)明示的にしたものであり,
その結果得られた基本概念や概念間の関係を土台にしてモデルを記述で
きる概念体系 (by 溝口理一郎)
19
Slide 20
Slide 20 text
オントロジー 概念体系を記述するための方法論
n もう少し簡単に言うと…
u コンピュータにわかる形で知識を整理する必要
u まずは,言葉(概念)の整理が大事
p 言葉(語彙)や,その意味,それらの関係性を
他の人と共有できるように,決まった形(仕様)で,
書き下そう!…という取り組み
20
Slide 21
Slide 21 text
標準・規格
n 人工物の設計に標準・規格は不可欠
u 言語も機械も,情報システムも独自ルールで作成は可能
p ex.
• 「え」「w」「ぅ」の3文字だけの独自言語
• 独自規格のネジで作成した工作機械
• 独自回路,言語&11進数計算の情報システム
u 独自ルール では 他者とのやりとり が できない…
おはよう!
えwwwwぅえええ
えええぅえええええ
えええwwぅえ
wwぅ!
ルール(標準・規格)を定めることで,他者とのやりとりが実現
これにより,タスクを分業することなどが可能になる
21
Slide 22
Slide 22 text
標準・規格
n コンピュータ(≒工業製品)は規格の固まり
u ソフトウェアには物理制約がないため,
特に設計における自由度が大きい
u OSがハードウェアの差異を吸収することで,
OS上で動くアプリの自由度を確保する
p OSがアプリの自由度を規定すると考えても良い
u アプリ間,OS間ではAPI(Application Programming Interface)
という形でルールを規定
u ネットワークにおいてはプロトコル(Protocol)という
形でルールを規定
おはよう! おはよ〜
22
Slide 23
Slide 23 text
意味ネットワークとオントロジー
n 先ほど出てきた意味ネットワークと,
オントロジーは結局,同じものなのか違うのか?
n こたえ:
u オントロジーも,意味ネットワークを用いる
u 意味ネットワークの書き方について,
みんなで同じルールを守る…という制約がつく
Aさんが「猫」についてまとめている間,
Bさんは「犬」についてまとめて,
あとで,2つをくっつける…というようなことも可能に
オントロジーは,規約付きの意味ネットワーク!
23
Slide 24
Slide 24 text
オントロジーの要素:is-a
n 基本要素のうち,is-a, part-of は特に重要
n is-a = …である
u “XXX は YYY である” という関係を示す
p 人間 は 動物 である 人間 is-a 動物
p ソクラテス は 人間 である ソクラテス is-a 人間
u 上位・下位の関係性があり,推移律がなりたつ
p 推移律: A is-a B,B is-a C → A is-a C ※ 可換則はないので入れ替えはダメ
• 上の例だと, ソクラテス は 動物 である と言ってよい
人間
ソクラテス
is-a
下位概念 上位概念
24
Slide 25
Slide 25 text
オントロジーの要素:part-of
n 全体と部分の関係を表す
n part-of = …の一部
u “XXX は YYY の一部である” という関係を示す
p 東京 は 日本 の一部である 東京 part-of 日本
p 日本 は 世界 の一部である 日本 part-of 世界
u 推移律がなりたつとは限らない
p “とは限らない” なので,成り立つケースもある
私
腕 XX大学
私
XX大学
腕
part-of part-of
part-of
25
Slide 26
Slide 26 text
意外と判断には迷う…
n 人間 は 哺乳類 の一部 …も表現として正しい
u 人間 is-a 哺乳類 ? 人間 part-of 哺乳類 ?
u 私 は 大学 に所属している…じゃぁ 私 part-of 大学 ?
でもこれだと,私が大学の構成要素のような…
n このあたりは,英語のニュアンスとのズレも
u 仲間に加わる…は,英語だと Join (くっつく)だが,
日本語だと 混ざる(mix)だったりする
u is-a, part-of も基本的には英語のイメージで考える
Joint Mix
26
オントロジーの自動生成
n Wikipedia はじめ,ネットには様々なコンテンツ
n こうしたコンテンツからオントロジーを
自動生成しようとする試みも様々
n だが今のところ,人間の作業アシストレベルで,
完全に自動生成できるレベルにはない
u BERTなどの分散表現により,類似,関連する単語を
精度よく検出することはできるようになってきてはいる
28
Slide 29
Slide 29 text
オントロジーの構築
n オントロジーに対する2つの態度
u 対象世界の知識をどのように記述すべきか,
哲学的にしっかり考えてから作ろう!
u この世界は広すぎる,時間がないので効率重視,
多少のミスは許して,できる限り自動的に作ろう!
ヘビーオントロジー
ソフトオントロジー
29
まとめ
n 中期のAI研究では知識表現などに注目があった
u 具体アプリ:MYCIN
u 知識を書き下し,それに用いて振る舞う
p 知識の書き下しが大変なことも判明…
u 書き下せればいけそうではあるので,書いてみることに
p 意味ネットワーク,オントロジー
p 近年では,ネットでみんなが知識を書き込んでくれるので,
オントロジーの自動生成もそこそこ良い感じに (c.f. ワトソン)
31
Slide 32
Slide 32 text
明らかになった課題
n 知識をテキスト化するのはとても大変
n 管理するのもとても大変
n 具体的に “知識” として書き下せるものならいいが,
そうでない状態や,“知識”以外のものを含め,
どうにかうまく整理できないか…?
n 知識なりデータなりを,うまく分類・整理したい
32
Slide 33
Slide 33 text
フレーム問題
n 問題に関連する情報の境界線(フレーム)を
定めることは実は非常に困難
n 「隣の部屋にあるリンゴをとってきて」
u 部屋とは?リンゴとは?とってくるとは?
u その行為に,室温や湿度,明るさは関係ある?ない?
u 部屋に入るのに障害物(壁やドア)は壊していい?
u どうやったら壊せる?もしくは壊さず入るには?
…などなどなどなど
33
人間は“なぜか”必要な情報だけをうまく取り出し,
行動をすることができる
※ やっかいなことに自身が動くと相対的に環境の見え方も変わるので,常に上記の問題が繰り返される.
Slide 34
Slide 34 text
初期フレーム問題
n 状況の記述には膨大な知識と状態の記述が必要
u n種類の状態に,m種類の行為があるとするなら,
n × m 個の記述が必要になる
p 手の位置が (0,1,3) の時,(0,1,4)の時…・
p 親指を0.1度曲げる,伸ばす,「あ」という声を出す…
u ある行為を記述しようとしたとき,その行為によって
変化する事柄と,変化しない事柄を明示的に記述・推論
するならば,その量は指数関数的に増大する
34
将来補足