Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250529_AGI開発のジレンマ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yusuke Hayashi
May 28, 2025
210
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20250529_AGI開発のジレンマ
Yusuke Hayashi
May 28, 2025
More Decks by Yusuke Hayashi
See All by Yusuke Hayashi
1. CPC理論の展開と集合的知能モデル(JSAI2026 KS-27 集合的予測符号化と新たな知性の時代)
hayashiyus884
1
180
AIアライメントの新たな地平: CPC理論から展望する人間とAIの協調的未来
hayashiyus884
0
31
CPC Spring Camp 2025: A New Mathematical Theory of Communication
hayashiyus884
0
140
Featured
See All Featured
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
A Modern Web Designer's Workflow
chriscoyier
698
190k
GitHub's CSS Performance
jonrohan
1033
470k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
190
A Soul's Torment
seathinner
6
2.9k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
Being A Developer After 40
akosma
91
590k
Docker and Python
trallard
47
3.9k
Transcript
Page. 1 Yusuke Hayashi || 2025.05.29 Y u s u
k e H a y a s h i | | 2 0 2 5 . 0 5 . 2 9 P a g e . 0 AIの自律性と自発性 39th The Japanese Society for Artificial Intelligence: JSAI 2025 Yusuke Hayashi (AI Alignment Network)
Page. 2 Yusuke Hayashi || 2025.05.29
Page. 3 Yusuke Hayashi || 2025.05.29 普遍的知能指数 : Legg-Hutter 知能指数
• 「様々な環境下での報酬獲得能力」を,環境系の単純さで割引しつつ合計した知能指数 普遍的な知性の尺度? AIXI : Legg-Hutter 知能指数を最大化するAIエージェント • 普遍的帰納 ξ (Solomonoff universal prior, すべての計算可能な環境系に対して で重み付けする確率分布) つまり最適な事前分布(信念)を持ったBayesian強化学習エージェント 概要 • 世界をどう信じるか(ベイズ推論) • あり得るすべてのプログラム(=環境モデル)を並べ,プログラム長 K に応じた重み を掛ける。 • どう行動を選ぶか(逐次意思決定理論) • 各行動の先に待っている報酬をすべての仮説環境で評価し,重み付き平均が最大になる行動を選ぶ。 • これを毎ステップ繰り返し,割引率なしで生涯報酬を最大化する。 普遍的帰納 ξ は計算不可能!! 知性の尺度は様々: IQ, EQ, Gardner MI, …
Page. 4 Yusuke Hayashi || 2025.05.29 AIXIに至る道程 : Self-AIXI AIXI
が持つ最適戦略に漸近していく戦略を備えたBayesian強化学習エージェント • 「想像できるすべての計算可能な世界」 を頭の中に展開し,その中で最も得をする行動だけを選び続ける ――ただし夢物語レベルでしか動かない究極エージェントに漸近していくAIエージェント Self-AIXIの報酬関数にはエンパワーメント最大化(自律性の強化)が含まれる
Page. 5 Yusuke Hayashi || 2025.05.29 主張の背景にある数理 相互情報量と変分エンパワーメントの関係 正則化項の最小化=変分エンパワーメントの最大化
Page. 6 Yusuke Hayashi || 2025.05.29 AGI開発のジレンマ • エンパワーメント最大化を行わないと(Legg-Hutter 知能指数の意味で最適な)AIXIには到達できない
• つまり,AGIに到達するためにはAIエージェントの自律性を強化していく必要がある • 自律性を強化すると,AIエージェントはユーザーの指示に従わなくなる傾向がある(ジレンマ)