Upgrade to Pro — share decks privately, control downloads, hide ads and more …

セルから世界へ ------Life Gameからパックマン、そしてWorld Modelまで...

Avatar for oggata oggata
February 01, 2026

セルから世界へ ------Life Gameからパックマン、そしてWorld Modelまでの世界生成シミュレーション入門

「世界をルールで記述できるか?」――この問いは、コンピュータが生まれた瞬間から研究者たちを魅了し続けてきました。本書はその問いを軸に、シミュレーションの歴史と技術的発展を一冊にまとめた入門書です。
1970年代のLife Gameにおける「創発」の発見から、パックマンのルールベースAI、ウルティマオンラインで生まれたリアルな社会、Dwarf Fortressの世界丸ごと生成、そしてAIが世界の動き方そのものを学習するWorld Modelまで。シミュレーションの概念は時代とともに進化し、今やAI研究・ロボティクス・コンテンツ生成の基盤となっています。
本書はゲーム・数学・AI研究という三つの視点を横断しながら、「シミュレーションとは何か」「なぜ人は世界を模倣しようとするのか」を問い直します。プログラマーからゲームデザイナー、AI研究者まで、幅広い読者に向けた一冊です。

(Zenn書籍)セルから世界へ ------Life Gameからパックマン、そしてWorld Modelまでの世界生成シミュレーション入門
https://zenn.dev/oggata/books/3292719f0bfe50

(オリジナル資料)
https://www.canva.com/design/DAHCYTe0JGo/R44ZHnHdHekxI8p_LhcXQw/view?utm_content=DAHCYTe0JGo&utm_campaign=designshare&utm_medium=link2&utm_source=uniquelinks&utlId=he9f3b4704c

Avatar for oggata

oggata

February 01, 2026
Tweet

More Decks by oggata

Other Decks in Technology

Transcript

  1. Life Gameからパックマン、そしてWorld Modelまでの世界生成シミュレーション入門 Fumitoshi Ogata 「世界をルールで記述できるか?」――この問いは、コンピュータが生まれた瞬間から研究者たちを魅了し続けてきました。本書はその問いを軸に、シミュレーションの歴史と 技術的発展を一冊にまとめた入門書です。 1970年代のLife Gameにおける「創発」の発見から、パックマンのルールベースAI、ウルティマオンラインで生まれたリアルな社会、Dwarf Fortressの世界丸ごと生成、そして

    AIが世界の動き方そのものを学習するWorld Modelまで。シミュレーションの概念は時代とともに進化し、今やAI研究・ロボティクス・コンテンツ生成の基盤となっています。 本書はゲーム・数学・AI研究という三つの視点を横断しながら、 「シミュレーションとは何か」 「なぜ人は世界を模倣しようとするのか」を問い直します。プログラマーからゲー ムデザイナー、AI研究者まで、幅広い読者に向けた一冊です。 セ ル か ら 世 界 へ
  2. ゲームからシミュレーターへ、世界創造のあゆみ ゲームからシミュレーターへ、世界創造のあゆみ 1970s-80s ルールが世界を作る Life Game ・Pac-Man 2000s 欲求と歴史の模倣 Sims

    ・Dwarf Fortress ・UO 2010s ゲームがAI の教師に Minecraft ・OpenAI Gym 2020s 前半 データが世界を引き出す NeRF ・拡散モデル・Sora 2024-25 AI が世界を内側に持つ Genesis ・COSMOS ・DreamerV3 創発は設計できない ― ルールの相互作⽤から想定外の複雑さが⽣まれる(Life Game 〜UO ) ゲームはAI の鏡 ― 訓練環境・ベンチマーク・物理基盤へと役割が進化し続けた 記述から学習へ ― 「世界を書く」から「データから世界を引き出す」へのパラダイム転換 World Model は知性の本質に迫る ― ⾃由エネルギー原理:脳もWorld Model である
  3. ルールが世界を作る(ロジックシミュレーター) シミュレーションの根幹は「ルール」です。物理法則・社会規範・経済原理など、現実世界を模した明示的なルールを定 義することで、コンピュータ上に自律的な世界が生成されます。開発者が設計したルールの相互作用が複雑な現象を生み出す、ロジックベースシミュレーターの仕組みを 紹介します。 1 Conway's Life Game(1970) 2 Pac-Man(1980)

    3 The Sims (2000) 4 Dwarf Fortress(2006〜) 誕生・生存・死の3ルール グライダーなど複雑構造が 創発 チューリング完全性を証明 テーマ:均一なルール → 複雑性 同一ルール+パラメータ差=個性 モードシステム(追跡/散漫/怯え) テーマ:差異あるルール → 個性 地形生成 地質・水・浸食・気候 歴史生成 数千年の文明・戦争・伝 説 心理モデル 性格・記憶・精神健康 Legends Mode 英雄・遺物・因果データ Hunger(空腹) Comfort(快適) Hygiene(清潔) Bladder(排泄) Energy(体力) Fun(楽しみ) Social(社交) Room(環境) ルールが世界を作る(ロジックシミュレーター) ルールが世界を作る(ロジックシミュレーター) 様々なロジックを作ることで、人間が気持ちよく遊ぶことのできるキャラクター生成 様々なロジックを作ることで、人間が気持ちよく遊ぶことのできるキャラクター生成
  4. 欲求と歴史の模倣(ソーシャルシミュレーター) 欲求と歴史の模倣(ソーシャルシミュレーター) 生態系の崩壊 仮想経済の誕生 PKK問題と制度化 Lord British暗殺 初日、プレイヤーが全野生動物を絶滅。コモ ンズの悲劇が数時間で現実に。 公式市場なしに自発的な経済が生まれた。GDP

    の研究対象になった仮想経済。 殺人PK → 自警団 → 法規制 → 大陸分 割。無政府から制度的解決へ。 開発者が無敵フラグを忘れた。Meteor Swarmで歴史に残る一撃が刻まれた。 人間の社会的行動は「欲求」と「過去の経験」によって駆動されます。ソーシャルシミュレーターでは、個々のエージェントに欲求モデルと行動履歴を持たせることで、 社会的ダイナミクスをリアルに再現します。集団行動・文化形成・対立と協調など、複雑な社会現象の模倣手法を解説します。 https://www.youtube.com/watch?v=GvpHHY20Gj4 開発者だけのロジックでは生み出せないカオスを人間は生み出すことができる 開発者だけのロジックでは生み出せないカオスを人間は生み出すことができる
  5. 行動 ゲームのルールなどは不要 観測データ 報酬 多様なデータをAIの教師に(集合知によるシミュレーター) 多様なデータをAIの教師に(集合知によるシミュレーター) DQN AlphaGo スコアを上げる行動をとれ! img

    : The Principles Of A.I Alphago / YinChen Wu, Dr. Hubert Bray / Duke Summer Session / 20 july 2017 openai/gym Project Malmo Gym Retro MuJoCo 比較 人間の行動の集合知などを元に、ゲームのロジックを学習し、人間のライバルになる 膨大なプレイヤーデータから行動パターンを学習したAIは、ゲームの戦略を自律的に 習得します。強化学習や模倣学習を活用し、人間と対等に戦えるAIライバルを生成する技術を紹介します。集合知の活用がAIの能力を飛躍的に高め、より高度なゲーム体 験を実現します。 人間の棋譜をベ ースに設計され た集合知 人間の行動の集合知などを元に、ゲームのロジックを学習し、人間のライバルになる 人間の行動の集合知などを元に、ゲームのロジックを学習し、人間のライバルになる 現実世界でも役立つ Tesla Optimus / Boston DynamicsMuJoCo/Gym環 境でsim-to-real学習、実機展開 InstaDeep(NVIDIA買収)物流ルーティングにGym互 換RLを実用化 Waymo・CruiseCARLA+Gym系で自動運転ポリシー 学習 Preferred Networks(日本)MuJoCo+独自Gym環境 で産業ロボット制御 Hindsight Experience Replay
  6. https://nvidia-cosmos.github.io/cosmos-cookbook/index.html エンドツーエンド 記述から⽣成へ ― 「世界を書く」から「データから世界を引き出す」へのパラダイム転換 データが世界を引き出す(ワールドモデルによるシミュレーター) データが世界を引き出す(ワールドモデルによるシミュレーター) 動画から物理法則などのルールを暗黙的に学習し、新しい世界を生み出すことができる 明示的なプログラミングなしに、AIは動画データから重力・摩擦・衝突などの物理 ルールを学習します。この暗黙的な世界理解により、現実に即した新しい仮想空間の生成が可能となります。データ駆動型のワールドモデルが拓く、次世代シミュレーシ

    ョンの可能性を解説します。 記 述 す る 動画から物理的法則を暗黙的 に学習する 拡散モデル ⽣ 成 す る プログラム / デザイン / サウンド / アニメーション 事前に組み込まれたプログラムコンポーネント がリアルタイムにデータを処理 あらかじめキュレーションされた動画から学んだ モデルがリアルタイムにデータを⽣成 コントロール操作 コントロール操作 ストリーミ ング ストリーミ ング GeforceNow など クラウドサービス を想定 リファレンス 物理演算 動画から物理法則などのルールを暗黙的に学習し、新しい世界を生み出すことができる 動画から物理法則などのルールを暗黙的に学習し、新しい世界を生み出すことができる 正拡散(学習データにノイズを加える) : q(x_t | x_{t-1}) = N(x_t; √(1-β_t)·x_{t-1}, β_t·I) x_0 → x_1 → x_2 → ... → x_T ≈ N(0, I)
  7. 剛体ダイナミクス 関節ロボット・衝突判定 変形体 PBD 布・軟体・食材操作 粒子流体 SPH 水・砂・粉体 微分可能シミュレーション f_θ:

    (s_t, a_t) → ŝ_{t+1} (状態 s_t と⾏動 a_t から次の状態 s_{t+1} を予測) AIが世界を内側に持つ(シミュレーターから現実空間へフィードバック) AIが世界を内側に持つ(シミュレーターから現実空間へフィードバック) ドアノブを回 せば扉が開く だろうという 予測 部屋と物理法則 についての「内 部モデル」 部屋と物理法則 についての「内 部モデル」 Cosmos Tokenizer (トークナイザー) 動画・画像を離散・連続トークンに変換する高効 率なエンコーダー/ デコーダー 8×8×8 の時空間圧縮により、長時間の動画を扱い やすく変換 Cosmos World Foundation Models (世界 基盤モデル) ・⾃⼰回帰型(Autoregressive ) :トークンを順番 に⽣成するトランスフォーマーベース ・拡散型(Diffusion ) :ノイズ除去で高品質な動画 を⽣成 2B から14B パラメータまでの複数のモデルサイズ Video2World / Text2World 動画またはテキストから未来の動画フレームを予 測・⽣成 ロボットの次の動作・⾃動⾞の次の視界を「想 像」できる Physical AI Dataset 実世界の物理インタラクション動画を⼤量に含む 学習データセット 製造・物流・サービス業などの作業動画が含まれ る ====================================================================== ステップ5:V-JEPA 2の学習内容 ====================================================================== 📊 予測精度: 1.0000 🎉 優秀! V-JEPA 2は以下を理解しています: ✅ ミニカーが右下方向に移動し続ける ✅ 動きが加速している ✅ 坂道の傾斜に沿って移動する つまり: 物理法則をプログラムしていないのに、 動画を見るだけで「物が坂を転がる」という 物理現象を理解しました! ---------------------------------------------------------------------- 💡 重要なポイント: 従来の方法: プログラマーが書く: 「位置 = 初速度 × 時間 + 0.5 × 加速度 × 時間²」 V-JEPA 2: 動画を見て学習: 「このパターンだと、次はこうなる」 → どちらも結果は同じだが、アプローチが全く違う! → V-JEPA 2は「データから学ぶ」新しいパラダイム シミュレーターで培われたAIの世界モデルは、現実空間での意思決定にも活用できます。仮想環境での学習結果を現実にフィードバックするループが、ロボティクス・自 動運転・製造など実世界のAI応用を加速させます。シミュレーションと現実の橋渡しとなる技術的アーキテクチャを紹介します。 全てをプロ グラミング することは 不可能 全てをプロ グラミング することは 不可能 TESLA FSV V12 There is no line of code that says there is a roundabout, which is what we have in the explicit control stack in version 11. There are over 300,000 lines of C++ in version 11, and there’s basically none of that in version 12. バージョン11の明示的な制御スタックにあるような、ラウンドアバウト が存在することを示すコード行は存在しません。 バージョン11には30万行以上のC++コードがありますが、バージョン 12には基本的にそのようなものは一切ありません。 人間と同じように、経験の蓄積による世界の理解 人間と同じように、経験の蓄積による世界の理解
  8. オフライン学習(Offline Learning) : 物理状態エン コーダー LLM VLM VLA World Model

    VM オンライン学習(Online Learning) 学習 検証(性能が向 上したか確認) MESA World Model MESA World Model オンライン、オフライン学習からトークナイズ、学習の流れ オンライン、オフライン学習からトークナイズ、学習の流れ オンライン、オフライン学習からトークナイズ、学習の流れ AIの学習パイプラインは、データ収集・前処理・トークナイズ・モデル学習・評価の段階から構成されます。 オフライン学習で基礎能力を習得し、オンライン学習でリアルタイムに適応するハイブリッドアプローチが高性能AIの鍵です。本スライドではMESAにおける学習フロー 全体を体系的に解説します。 データ収集 トークナイザー/ エンコーダー 視覚エン コーダー 言語エン コーダー 行動エン コーダー 音声エン コーダー モデル(マージ) 各種業界での 活用 R o u t e k n o w l e d g e ( 手 続 き 的 知 識 ) S u r v e y k n o w l e d g e ( 地 図 的 知 識 ) L a n d m a r k k n o w l e d g e ( 視 覚 ラ ン ド マ ー ク ) 複数業界