Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20250529_AGI開発のジレンマ

Avatar for Yusuke Hayashi Yusuke Hayashi
May 28, 2025
180

 20250529_AGI開発のジレンマ

Avatar for Yusuke Hayashi

Yusuke Hayashi

May 28, 2025
Tweet

Transcript

  1. Page. 1 Yusuke Hayashi || 2025.05.29 Y u s u

    k e H a y a s h i | | 2 0 2 5 . 0 5 . 2 9 P a g e . 0 AIの自律性と自発性 39th The Japanese Society for Artificial Intelligence: JSAI 2025 Yusuke Hayashi (AI Alignment Network)
  2. Page. 3 Yusuke Hayashi || 2025.05.29 普遍的知能指数 : Legg-Hutter 知能指数

    • 「様々な環境下での報酬獲得能力」を,環境系の単純さで割引しつつ合計した知能指数 普遍的な知性の尺度? AIXI : Legg-Hutter 知能指数を最大化するAIエージェント • 普遍的帰納 ξ (Solomonoff universal prior, すべての計算可能な環境系に対して で重み付けする確率分布) つまり最適な事前分布(信念)を持ったBayesian強化学習エージェント 概要 • 世界をどう信じるか(ベイズ推論) • あり得るすべてのプログラム(=環境モデル)を並べ,プログラム長 K に応じた重み を掛ける。 • どう行動を選ぶか(逐次意思決定理論) • 各行動の先に待っている報酬をすべての仮説環境で評価し,重み付き平均が最大になる行動を選ぶ。 • これを毎ステップ繰り返し,割引率なしで生涯報酬を最大化する。 普遍的帰納 ξ は計算不可能!! 知性の尺度は様々: IQ, EQ, Gardner MI, …
  3. Page. 4 Yusuke Hayashi || 2025.05.29 AIXIに至る道程 : Self-AIXI AIXI

    が持つ最適戦略に漸近していく戦略を備えたBayesian強化学習エージェント • 「想像できるすべての計算可能な世界」 を頭の中に展開し,その中で最も得をする行動だけを選び続ける ――ただし夢物語レベルでしか動かない究極エージェントに漸近していくAIエージェント Self-AIXIの報酬関数にはエンパワーメント最大化(自律性の強化)が含まれる
  4. Page. 6 Yusuke Hayashi || 2025.05.29 AGI開発のジレンマ • エンパワーメント最大化を行わないと(Legg-Hutter 知能指数の意味で最適な)AIXIには到達できない

    • つまり,AGIに到達するためにはAIエージェントの自律性を強化していく必要がある • 自律性を強化すると,AIエージェントはユーザーの指示に従わなくなる傾向がある(ジレンマ)