LLM ・VLM ・VLA が協調し「なぜ⾏動するか」 「何を⾒て判断 するか」 「どう動くか」の3 層が統合されます。ペルソナ・経 験・記憶を持つ真に人間らしいエージェントを実現します。 パックマン RULE-BASED 1980s 〜 予測可能・実装が簡単 OpenAI GYM REINFORCEMENT 2016 〜 多様な動き・未知環境への適応 MULTI-AI Next 個性・迷い・成長・記憶を持つ 行動 DQN NPCの進化の歴史と、MESAの位置づけ NPCの進化の歴史と、MESAの位置づけ オンライン、オフライン学習からトークナイズ、学習の流れ オンライン、オフライン学習からトークナイズ、学習の流れ かつてのNPCはルールベースのロジックで動いていました。OpenAI Gymのような強化学習環境で人間の行動データを取り込むことで多様な動きが可能になりましたが、 それでも「目的に向かって最短経路を取る最適化エージェント」の域を出ませんでした。 1 Conway's Life Game(1970) 2 Pac-Man(1980) 誕生・生存・死の3ルール グライダーなど複雑構造が 創発 チューリング完全性を証明 テーマ:均一なルール → 複雑性 同一ルール+パラメータ差=個性 モードシステム(追跡/散漫/怯え) テーマ:差異あるルール → 個性 3 The Sims (2000) 4 Dwarf Fortress(2006〜) 地形生成 地質・水・浸食・気候 歴史生成 数千年の文明・戦争・伝 説 心理モデル 性格・記憶・精神健康 Legends Mode 英雄・遺物・因果データ Hunger(空腹) Comfort(快適) Hygiene(清潔) Bladder(排泄) Energy(体力) Fun(楽しみ) Social(社交) Room(環境) ゲームのルールなどは不要 観測データ 報酬 AlphaGo スコアを上げる行動をとれ! img : The Principles Of A.I Alphago / YinChen Wu, Dr. Hubert Bray / Duke Summer Session / 20 july 2017 openai/gym R o u t e k n o w l e d g e ( 手 続 き 的 知 識 ) S u r v e y k n o w l e d g e ( 地 図 的 知 識 ) L a n d m a r k k n o w l e d g e ( 視 覚 ラ ン ド マ ー ク )