Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語の限界とAIの限界
Search
potatoapple314
October 14, 2025
0
43
自然言語の限界とAIの限界
potatoapple314
October 14, 2025
Tweet
Share
Featured
See All Featured
Docker and Python
trallard
46
3.6k
Visualization
eitanlees
149
16k
YesSQL, Process and Tooling at Scale
rocio
173
15k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
Build your cross-platform service in a week with App Engine
jlugia
233
18k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
2.9k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.2k
Automating Front-end Workflow
addyosmani
1371
200k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
127
54k
Six Lessons from altMBA
skipperchong
29
4k
A better future with KSS
kneath
239
18k
BBQ
matthewcrist
89
9.9k
Transcript
自然言語の限界とAI の限界 副題:恣意性・規約・形式仕様(やわらか解説) 1
目次 1. 言葉は「形」と「意味」のペア 2. 恣意性=名前と中身は約束ごと 3. 具体例②: 『ぽーいってして』事件 4. 具体例①:
『頭が赤い魚を食べる猫』 5. 具体例③:ブランコ漫画(現場のズレ) 2
6. なぜ限界が起きる?(地図と現地) 7. LLM にどう写る? 8. 今井むつみ:なぜ伝わらないのか 9. 語義の形式化(人にもAI にも効く)
10. 思考の形式化 3
世界には言語が二種類あります 4
自然言語(人間が日常的に使う、曖昧さ・文脈依存あり) 日本語: 「今日はいい天気ですね」 英語:"I'm going to the library tomorrow." フランス語:"Comment
ça va ?" (元気ですか?) 形式言語(厳密に定義され、曖昧さがない。数学・コンピュータで利用) 数学記法:∀x ∈ ℝ, x² ≥ 0 プログラミング: if (x > 0) { y = 1; } else { y = -1; } 正規表現: ^[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.(com|net|org)$ 5
なぜ形式言語なんてものがあるのか? 6
自然言語には限界があるからです(T_T) 7
自然言語ってどう曖昧なの? 8
1) 言葉は「形」と「意味」のペア シニフィアン(形) :音や文字(例: 「き」や「木」 ) シニフィエ(意味) :頭の中のイメージ(幹・枝・葉のある植物) 例:犬 形=「いぬ」/「犬」
意味=「四本足で吠える動物」 9
同じ“ 猫” でも 英:cat /独:Katze /中:mao → 形は違うが、指す概念はほぼ同じ 10
2) 言語の恣意性(=約束ごと) 形と意味の結びつきは自然必然ではない(社会の取り決め) 文化によりニュアンスが揺れる 要するに: 「名前」と「中身」は“ そう決めたから” つながっている 11
3) 具体例①: 『ぽーいってして』事件 ある母親と子供の話で、子供の足元にボールが転がってきた。私( 母親) はやや離れたと ころにたっていた。そこで「娘ちゃん、ボールぽーいってして。 (投げて) 」
その子は 不思議そうな顔をしてボールをゴミ箱に捨てた 12
状況:子の足もとにボール、母とあなたは少し離れて立つ 発話: 「ボール、ぽーいってして(投げて) 」 結果:子はゴミ箱へ捨てた 「ぽい」= 投げる?捨てる? → 文脈と連想の差で分岐 同じ言葉でも、人によって頭に浮かぶ意味が違う――
それがズレの正体。 13
どこでズレた? 語の多義: 「ぽい」= 放る/捨てる 目的地欠落: 「誰に・どこへ」が不明 文脈バイアス:目の前にゴミ箱 擬態語は幅広い:年齢・経験で差が大きい 修正版 「足もとのボールをママのところに、下投げで1
回投げて。ゴミ箱には入れないで ね」 14
4) 具体例②: 『頭が赤い魚を食べる猫』 頭が赤い魚を食べる猫 15
『頭が赤い魚を食べる猫』絵を書いてみてください 16
17
!? 18
A :[ 頭が赤い] [ 魚を食べる] 猫(= 猫の頭が赤い) B :[ 頭が赤い
魚] を食べる 猫(= 魚の頭が赤い) 19
20
この通り、この一文だけでも5 通りも意味を含んでる 21
A :[ 頭が赤い] [ 魚を食べる] 猫(= 猫の頭が赤い) B :[ 頭が赤い
魚] を食べる 猫(= 魚の頭が赤い) C 〜E :言葉遊び的読み(主体= 頭、頭だけ猫 など) 実務では A/B の取り違えが事故の温床 22
A/B の誤解を防ぐ書き換え A : 「頭が赤い猫が魚を食べる」 B : 「頭が赤い魚を猫が食べる」 コツ:修飾語は名詞の直前/「の・だけ」で関係固定/主語を明示 23
24
25
5) 具体例③:ブランコ漫画(現場のズレ) 同じ「ブランコ」でも立場ごとに像が違う → 仕様ズレ 教訓:言葉は現実に直結しない/用語集・図・試作品で共通理解をつくる 26
6) なぜ限界が起きる?(地図と現地) 多義性:一語に複数の意味( 「ここ」 ) 文脈依存:誰が・どこで・何の目的か 言語化の難しさ:頭の像を出力する途中で抜ける 例え:言葉は地図、現実は現地。地図だけでは段差や匂いは伝わらない 27
同じ自然言語を使うAI (LLM) でも同じ現象が起こる 28
29
30
AI (LLM )の出力は 先程のあなたがイメージした ( 絵で描いた) 『頭が赤い魚を食べる猫』でしたか? 31
32
同じ言葉でも、持つイメージは十人十色 33
また同じ全く同じ条件でAI (LLM )に出力させてみた 34
35
これと解釈したのかな?( 体はネコだけど。 。 。 ) 36
同じ全く条件なのに別の出力された 出力が安定しない 37
AI (LLM) も人間も 同じ言葉でも、持つイメージは十人十色 38
「話せばわかる」 は 「幻想」 かもしれない 39
そこで形式言語でAI (LLM) に伝えてみましょう 40
XML( 擬似コード= 形式言語) による指定 41
XML ってなに? XML は、データに 意味のラベル(タグ) をつけて整理するための 書き方(ルール) 例:段ボールに「本」 「写真」みたいなラベルを貼って中身を分かりやすくする 42
基本構造(タグと要素) <book> <title>吾輩は猫である</title> <author>夏目漱石</author> <year>1905</year> </book> <book> ... </book> が要素
中にさらに要素を入れ子にする → 木(ツリー)構造になる 43
人も機械も読めるテキスト タグ設計が自由 ルール(スキーマ)で厳密に検証できる 44
HTML との違い(ざっくり) HTML :見た目をどう表示するか(タグが決め打ち) XML :タグ名を自分で設計できる(意味づけが目的) 45
これを出したい 46
入力したプロンプト: <主語> <猫> <頭> <色>赤</色> </頭> </猫> </主語> <動作>食べる</動作> <目的語>
<魚/> </目的語> を描いて 47
48
これが形式言語のメリットです!! 意図が伝わる!!! 49
7) AI (LLM) にどう写る? LLM= 大量の文章から“ 使われ方” を学んだ機械 学習データに依存:それまでに学習したそれっぽい答えを返す 曖昧に弱い:かかり先が曖昧だともっともらしい確率で選ぶ
暗黙知の欠落:社内文化や暗黙知は明示化しない限り全く考慮されない 現地確認が苦手:テキスト内で整っても、外界で未検証 ( ハルシネーションの存 在) まとめ:AI(LLM) は学習したデータの言語のモデルであって、なんでも知っている わけではない 50
AI はあくまで言語の定義や規則が定められてて、伝え る内容に暗黙知がなくてすべてのデータを持っている ときに使える。 51
人間に伝えたり 教えたりするときも同じことが言え ませんか? 52
8) 今井むつみ著: 『 「何回説明しても伝わらない」は なぜ起こるのか?』 問題提起: 「話せばわかる」は幻想かもしれない。人はそ れぞれの スキーマ(自分の中の常識) で解釈するため、
同じ説明でも別の理解に変換されうる。 要点1 スキーマの違い:各人の知識枠組みが異なるの で、前提がズレると伝わらない。 要点2 認知バイアス:確証バイアス/選択的注意など で、都合のよい情報だけが残り判断が固着する。 要点3 心の理論 × メタ認知:相手の知識状態を推定し つつ、自分の前提や説明の枠を点検する視点が必須。 53
認知バイアス? 54
https://www.youtube.com/embed/IGQmdoK_ZfY 55
これが選択的注意です 56
人間が一度に頭に入る情報は限られてる 57
58
59
リンダ問題 例:エミのケース 「エミは27 歳、明るく社交的で、インスタグラムに旅行写真をよく載せる。大学では ファッションデザインを学んだ。 」 さて、次のどちらの可能性が高いでしょうか? : エミはアパレルショップの店員である。 :
エミはアパレルショップの店員で、インフルエンサー活動をしている。 60
設定(エミ版) 事象 :エミはアパレルショップの店員 事象 :エミはインフルエンサー活動をしている 結合 ( ) :店員 かつ
インフルエンサー 以降, を AND (かつ) , を OR (または)として使います。 61
集合の関係 大きな円: (店員) その中の小さな重なり領域: (店員かつインフルエンサー) 面積の大小が確率の大小に対応 62
A:店員 B:インフ ルエンサー P(A) P(A∩B) 63
キーメッセージ は の一部 → 面積は常に小さい(または等しい) したがって 64
これでも自分を信用できますか? 65
AI にもバイアスがあります 66
AI は数字がわからない https://levtech.jp/media/article/column/detail_643/ 67
AI は政治バイアスがある https://note.com/ainest/n/n1725a10186a0 68
私達が使ってる自然言語も思考も、 手放しに信用しちゃいけないと思いませんか? 69
じゃあ、何を信用するべきか? 70
そのために数学やプログラミング言語などの 形式言語が開発されました。 71
9) 語義の形式化(人にもAI にも効く) [ 対象] [ 動作] [ 目的地/ 相手]
[ 方法/ 条件] [ 禁止/ 例外] 例(修正版) 「足もとのボールを、ママのところに、下投げで1 回投げて。ゴミ箱は不可」 擬似コード化 throw(ball, to=Mom, style=underhand, times=1, forbid=[trash_can]) “ 一意なカタ” へ半歩寄せるだけで、誤解は激減する。 72
10) 思考の形式化 73
火がないところに煙が立たないってことわざあります よね? 74
物理世界では 火がある ならば 煙が立つ は正しい 煙が立つ ならば 火があるといえる? 75
命題 :火がある 命題 :煙が立つ が正しいからといって が成り立つとは限らない。 76
ある命題 が真であるとします。このとき、条件 に対応する集合 に は、 という包含関係があります。 また、 が真である時 77
つまり 命題 :火がある 命題 :煙が立つ のとき 煙が立つ ならば 火があるの対偶として ことわざの火がない
ならば 煙が立たないを考えると これは論理的に正しくありません。 78
これを対称性バイアスといいます 79
対称性バイアスとは ある関係 が成り立つとき、 も成り立つと“ 思い込む” クセ 例: 「不正があれば噂が立つ」→ ◦ 「噂が立つなら不正がある」→
× (かもしれない、に過ぎない) 80
思考を形式化すれば論理的に機械的にチェックするこ とで思考の誤りを防げます 81
言葉 だけでは経験を運べない。だから“ 足場づくり” が 鍵。 出典要約:今井むつみ『 「何回説明しても伝わらない」はなぜ起こるのか?』 82
暗黙知を含む社内ルールや文書を形式化しませんか? 83