【概要版】考察ノート：「AGIリスク」の議論にどう向き合えばいいのか Ver.1

Slide 1

Slide 1 text

202410　【考察ノート】「AGIリスク」の議論にどう向き合えばいいのか（概要スライド） 1 【考察ノート】「AGIリスク」の議論にどう向き合えばいいのか 2024年9月29日公開レポートの概要版丸山隆一　レポートはこちら：https://researchmap.jp/rmaruy/published_works

Slide 5

Slide 5 text

202410　【考察ノート】「AGIリスク」の議論にどう向き合えばいいのか（概要スライド） 1.1　AGIとは何か　 5 狭い(Narrow) 汎用的(General) レベル0：AIなし例：電卓ソフトウェア、コンパイラ例：アマゾンメカニカルタークレベル1：萌芽的（emerging）人間の初心者と同等、またはやや優れている萌芽的な狭いAI 萌芽的なAGI 例：ChatGPT、Claude、 LLaMA、Gemini レベル2：有能（competent）スキルを持つ大人の50%以上のパフォーマンス例：多数有能なAGI：未達成レベル3：専門家（expert）スキルを持つ大人の90%以上のパフォーマンス例：スペル＆文法チェッカー（Grammarlyなど）、生成画像モデル（Stable Diffusion、Dall-E 2など）専門家AGI：未達成レベル4：達人（Virtuoso）スキルを持つ大人の99％以上のパフォーマンス例：チェス（Deep Blue）、囲碁（AlphaGo）達人AGI：未達成レベル5：超人間（Super human）人間の100％を上回る例：タンパク質構造予測（AlphaFold）、囲碁（AlphaZero）、チェス（StockFish）超知能（ASI）：未達成表1-1　パフォーマンスと汎用性によるAIの分類（出典：Morris et al. (2023) のTable 1を簡略化して引用） ● AGI（人工汎用知能）は、人間のように広範なタスクをこなせるAI。1950年代のAI研究の原点に立ち返るべく2000年代に作られた言葉。 ● OpenAIは「ほとんどの経済的に価値のある仕事で人間を凌駕する高度に自律的なシステム」と定義。 ● AGIの定義は研究者によって異なり、経済的価値、パフォーマンス、人間の脳との類似性など、様々な観点がある。 ● Google DeepMindは2023年、AGIを「汎用性」と「パフォーマンス」の2軸で評価する実用的なタクソノミーを提案。 ● 【考察】AGIの定義が明確ではない。ビジネス上の戦略や学術的な扱いやすさから、別の概念に置き換えられる可能性もある。 OpenAI Charter. https://openai.com/charter/ Morris, M.R. et al. (2023). Position: Levels of AGI for Operationalizing Progress on the Path to AGI. International Conference on Machine Learning.　https://arxiv.org/pdf/2311.02462

Slide 11

Slide 11 text

202410　【考察ノート】「AGIリスク」の議論にどう向き合えばいいのか（概要スライド） 2.1　AGIリスク論の5つの流れ 11 1. トランスヒューマニストによるAGI脅威論：AGI脅威論はトランスヒューマニズムをとるEliezer Yudkowsky氏らを中心とする限られたコミュニティ（「合理主義（rationalist）」運動）で展開。Nick Bostrom氏の著書『Superintelligence』は AGI脅威論を広く普及させる一つの契機に。 2. 科学者と哲学者＋フィランソロピストによる「exsistential risk」の議論：フィランソロピー資金を背景に、英米の大学にexistential riskを研究するセンターが複数設立し、AIリスクがその中心に。非営利組織Future of Life Institute （FLI）は、2017年には超知能に関する記述も含む「アシロマAI原則」を発表。 3. 効果的利他主義によるAIリスク論の推進：2009年頃から世界中に広がった効果的利他主義は、重要性（importance）、改善の可能性（tractability）、看過されやすさ（neglectedness）の三要素からAIのリスクを重視し、活発に活動。 4. AGI企業・AIセーフティ系non-profitの台頭：OpenAIやそこから分岐したAlignment Research CenterやAnthropicにてAI セーフティ研究推進。近年、米国西海岸を中心に、AIセーフティに特化した非営利組織（non-profit）が次々と誕生。 5. 政府の取り組みとの連携：近年、英米の政府のイニシアチブとの接点が生じ始めている（例：米国AI Safety Institute はAGIのアライメント研究の第一人者であるPaul Christiano氏をhead of AI safetyに抜擢） ● ChatGPTの衝撃で、分野の第一人者もAI脅威論に転向する動きあり（Yoshua Bengio氏、Douglas Hofstadter氏）。 ● 人類を破滅に追いやるようなAIが出現する確率「p-doom」の議論も。ただし、物理学者のMichael Nielsen氏は絶滅の確率（p-doom）を「概念的ハザード（conceptual hazard）」と指摘。

Slide 14

Slide 14 text

202410　【考察ノート】「AGIリスク」の議論にどう向き合えばいいのか（概要スライド） 2.4　英米以外の組織 14 ● AGIリスクに取り組む組織はほとんどが米国、それもサンフランシスコ近辺に密集。 ● ただし過去1、2年、世界の様々な地域でAGIリスクをスコープに入れた組織や活動が見られるようになってきている。網羅的な調査はできていないが、以下はその一例である。 ● Chinese AI Safety Network：中国に存在しているAIセーフティに関わる組織間の対話、国際協力のためのプラットフォームとして設立。 ● 台湾での動き：シビックハッカーコミュニティであるg0vのメンバーらが、OpenAIの“Democratic Inputs to AI” という助成プログラムに採択され、デジタル民主主義の活動（vTaiwan）のプロセスを使ったマルチステークホルダーの意思形成手法を提案。 ● AI Safety Asia：アジアにおける「壊滅的なAIリスク」を低減し、世代を超えたAI政策対話、アジアのグローバルサウス諸国とグローバルノースのAIセーフティ研究者を結びつけることを掲げる非営利組織として、2024年設立に設立。 ● Equiano Institute：アフリカとグローバルサウスのためのAIセーフティ研究所を掲げる組織。ケニアと南アフリカに拠点を持つ。2023年設立。日本での動きとしては以下がある。 ● AI Safety Tokyo：東京を起点にAI Safetyに関連する勉強会等の啓発活動を展開する団体。主に日本在住の海外出身の研究者・エンジニアが参加。2024年4月、国際会議Technical AI Safety Conference 2024を主宰。 ● 一般社団法人AIアライメントネットワーク：2024年4月ころから活動開始。AIの長期リスクに関する啓発活動、コミュニティ運営のほか、理事らを中心に独自の研究活動を展開。

Slide 16

Slide 16 text

202410　【考察ノート】「AGIリスク」の議論にどう向き合えばいいのか（概要スライド） 3.1　「AIセーフティ」と「AIアライメント」 16 ● （技術的）AIセーフティ：AGIリスク論に出自を持つが近年はより広範に用いられている（例：リスク管理と安全工学、公平性と代表性のための技術、プライバシー保護技術など） ● AIアライメント：AIアライメントは、Stuart Russell氏が提唱した「Value Alignment問題」に由来。「AIシステムの目標と行動が、その開発者の価値観や意図に沿うようにする」という狭い定義。Google DeepMind所属の倫理学者Iason Gabriel氏らは、「開発者・ユーザ・AI・社会」の4項関係でアライメントを捉えることを提案。 ● AIセーフティ/アライメントの「広さ」と「今の技術か／未来の技術か」の2軸で捉えてはどうか（表）。 ● AGIリスク論におけるAIセーフティ／AIアライメントとは、主に（2）と（4）。 ● LLMの不適切な出力を抑える問題は（1）。例：AnwarらはLLMのアライメントと安全性の未解決問題を1）LLMの科学的理解、2）訓練手法や実装場面の課題、3）社会における課題に分け、広範な文献調査に基づき200超のリサーチクエスチョンを同定。今あるAIへの対応未来のAIへの対応 AIモデル単体レベルの対応（1）（2）複数のAIシステムや人が混在する系への対応（3）（4）表3-2　AIセーフティ／AIアライメントの大まかな4分類 Anwar, Usman et al. (2024). “Foundational Challenges in Assuring Alignment and Safety of Large Language Models.” ArXiv abs/2404.09932 丸山隆一 note（2024.6）「AIアライメント／AIセーフティの4つの問題領域」 https://note.com/rmaruy/n/n80ebb81c6036

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text