GPT-5と寿司合戦を攻略する

by GO Inc. dev

Embed

Start on current slide

Slide 1

Slide 1 text

AI 2025.08.21 田村和樹 GO株式会社 GPT-5と寿司合戦を攻略する

Slide 2

Slide 2 text

AI ▪ 8/8にOpenAIからGPT-5がリリースされた ▪ バラエティ『水曜日のダウンタウン』で行われた企画「寿司合戦」の最適な戦略を探すことをテーマにGPT-5を試してみた ▪ なお、発表者は数理最適化や強化学習の分野には明るくないはじめに

Slide 3

Slide 3 text

AI 1. GPT-5と寿司合戦について 2. ゲームの定式化と諸設定 3. 戦略の検討 4. まとめアジェンダ

Slide 4

Slide 4 text

AI 1. GPT-5と寿司合戦について 2. ゲームの定式化と諸設定 3. 戦略の検討 4. まとめアジェンダ

Slide 5

Slide 5 text

AI ▪ 8/8にリリースされた現在OpenAIの中で最も高性能・速度・汎用性を持つモデル ▪ 特にコーディング・数学・文章生成・ヘルス領域など実務寄りのタスクで正確性と再現性が大きく向上 ▪ 前モデルを「賢い大学生」と表現したのに対し、「博士号を修得した専門家」と表現 ▪ 発表時のデモでは、飛行機が飛ぶ原理であるベルヌーイ効果について説明させ、アプリケーションを4分程で作成した GPT-5について発表配信より

Slide 6

Slide 6 text

AI ▪ 5月21日放送の『水曜日のダウンタウン』（TBS系）で行われた企画 ▪ 簡単なルール紹介 ▪ コンビ対コンビで回転レールで運ばれてきた寿司を食べる ▪ 食べた皿を自陣に積み上げるか相手の積み上がった皿に投げて崩すかを選択できる ▪ 一度積み上げた皿や投げて外した皿を再度投げることはできない ▪ 制限時間終了時点で多く皿が積み上がっていたコンビの勝ち寿司合戦について

Slide 7

Slide 7 text

AI 1. GPT-5と寿司合戦について 2. ゲームの定式化と諸設定 3. 戦略の検討 4. まとめアジェンダ

Slide 8

Slide 8 text

AI ▪ コンビではなく1対1の勝負とする ▪ 相手と自分の食べる能力と投げる能力(後述するq)は同じ ▪ 以下を1ステップとし、Nステップ繰り返す ▪ お互いに食べた枚数の皿を食べる(持つ) ▪ 個々の皿は積み上げるか投げるかを選択できる ▪ 投げる場合、確率qで命中し、積み上げられた皿の枚数Sに対してB(S,d) 枚崩れるとする ▪ Nステップ後に多く皿が積み上がっていた方の勝ちゲームルールの定式化

Slide 9

Slide 9 text

AI ▪ ステップごとに食べた皿をどれだけ投げるかを「戦略」と呼ぶ ▪ 相手は全てのステップで、固定された戦略(割合)で皿を投げてくるとする ▪ ゲーム開始時点では相手の戦略はわからない ▪ 後述する様々な自分が持つ戦略で200回勝負し勝率を測る戦略の評価

Slide 10

Slide 10 text

AI 1. GPT-5と寿司合戦について 2. ゲームの定式化と諸設定 3. 戦略の検討 4. まとめアジェンダ

Slide 11

Slide 11 text

AI ▪ GPT-5にゲームルールや諸条件を伝えたところ、3つのモデル(戦略)を提案してくれた GPT-5に相談

Slide 12

Slide 12 text

AI ▪ 未知である相手の戦略(つまり皿を投げる確率)を最尤法で逐次的に求め、自分も全く同じ戦略をとる ▪ 相手の戦略を観察し「自分の判断の基準」を作る ▪ 限界: 相手と同じ戦略を取るので差をつけられない(勝率は五分五分) 戦略1 : ミラー

Slide 13

Slide 13 text

AI ▪ 最尤法で求めた相手の戦略から線形変換した戦略をとる ▪ 相手と同じでは勝てない → 推定した戦略を少しずらして「こちらが有利になる方向に変換」 ▪ 改善点: 単純模倣から「相手を利用して差をつけに行く」発想への進化 ▪ 限界: 線形変換なので調整幅に限界がある。極端な相手には強いが、中庸な相手には対応が難しい戦略2 : カウンター(線形)

Slide 14

Slide 14 text

AI ▪ GPT-5「線形の限界を超えるために非線形関数で柔軟に変換」 ▪ 線形では表現しきれなかった「相手の戦略に応じた微妙な調整」が可能になり、ほとんどの場合で勝ち越せている ▪ 「柔軟に変換」とあるが、相手がどんな戦略をとってきても戦略0.52付近をとるという戦略になっていた戦略3 : カウンター(非線形)

Slide 15

Slide 15 text

AI ▪ 少しでも相手が投げるor食べる能力が高いと全く勝てなくなってしまう ▪ GPT-5からいくつか改善策をもらったが別の機会に... 課題

Slide 16

Slide 16 text

AI 1. GPT-5と寿司合戦について 2. ゲームの定式化と諸設定 3. 戦略の検討 4. まとめアジェンダ

Slide 17

Slide 17 text

AI ▪ 「寿司合戦」をテーマにGPT-5の凄さを体感できた ▪ 「相手の戦略を特定し対策を立てる」という点が最もらしいし、勝ち越せる戦略に辿り着けた ▪ シミュレーションのコードはほとんど書いてくれた ▪ 相手の戦略に加えて能力も加味することが今後の課題まとめ