Slide 1

Slide 1 text

ゲーム産業におけるAIアーキテクチャと 自動化工程 三宅 陽一郎 @miyayou [email protected] 2023.9.1

Slide 2

Slide 2 text

第I部:デジタルゲームAI 第II部:メタバースとスマートシティ

Slide 3

Slide 3 text

自己紹介

Slide 4

Slide 4 text

My Works (2004-2022) AI for Game Titles Books

Slide 5

Slide 5 text

近著

Slide 6

Slide 6 text

No content

Slide 7

Slide 7 text

No content

Slide 8

Slide 8 text

戦略ゲームAI • 戦略ゲームにおける人工知能の技術を、 起源から集めた著作 • 2021年10月15日 • 300ページぐらい

Slide 9

Slide 9 text

リアルタイム ノンリアルタイム 身体を持つ 身体を持たない 身体を持ち リアルタイムに 空間を運動する 身体を持たず 空間を運動しない ゲーム・ロボット ビックデータ解析

Slide 10

Slide 10 text

ゲームAIの特徴 リアルタイム インタラクティブ 身体を持つ ゲーム VR/AR ロボット・ 自動運転 デジタルサイネージ ドローン エージェント・サービス

Slide 11

Slide 11 text

AIの分化(1994-2000) ゲームシステム メタAI キャラクターAI ナビゲーションAI 3つのAIシステムは序々に分化して独立して行った。 では、今度はナビゲーションAIについてさらに詳しく見てみよう。

Slide 12

Slide 12 text

デジタルゲームの人工知能における イノベーションのポイント① 「3つのAIの誕生」

Slide 13

Slide 13 text

レベルスクリプト ナビゲーションAI キャラクターAI メタAI 1995 2000 2005 2010 1994 (ゲームの3D化) 1999 (スクリプティッドAIによる 大型ゲームのキャラクター制御の限界。 自律型AI技術のアカデミックからの流入) 2005 (ウィル・ライトによる“メタAI”定義) 2008 (“LEFT 4 DEAD”に におけるAI Director) 2010頃~ (オープンワールド型 ゲームの隆盛) スパーシャルAI 1980 PlayStation (1994) Xbox360 (2005) PlayStation3 (2006) スクリプティッドAI 三宅陽一郎、水野勇太、里井大輝、 「メタAI」と「AI Director」の歴史的発展、日本デジタルゲーム学会(2020年、Vol.13, No.2) LS-Modelモデル LCN-AI連携モデル MCS-AI動的連携モデル MCN-AI連携モデル

Slide 14

Slide 14 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル(三宅,2020)

Slide 15

Slide 15 text

デジタルゲームの人工知能における イノベーションのポイント② 「キャラクターAI」 (MIT、スタンフォードの人材から)

Slide 16

Slide 16 text

デジタルゲームAI入門① (キャラクターAI)

Slide 17

Slide 17 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル

Slide 18

Slide 18 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル

Slide 19

Slide 19 text

知能の世界 環境世界 認識の 形成 記憶 意思の 決定 身体 制御 エフェクター・ 身体 運動の 構成 センサー・ 身体 意思決定 モジュール 意思決定 モジュール 意思決定 モジュール 記憶体 情報処理過程 運動創出過程 身体部分 情報 統合 運動 統合

Slide 20

Slide 20 text

FC SFC SS, PS PS2,GC,Xbox Xbox360, PS3, Wii DC (次世代) Hardware 時間軸 2005 1999 ゲームの進化と人工知能 複雑な世界の 複雑なAI ゲームも世界も、AIの身体と内面もますます複雑になる。 単純な世界の シンプルなAI (スペースインベーダー、タイトー、1978年) (アサシンクリード、ゲームロフト、2007年)

Slide 21

Slide 21 text

(例) スペースインベーダー(1978) プレイヤーの動きに関係なく、決められた動きをする (スペースインベーダー、タイトー、1978年)

Slide 22

Slide 22 text

(例)プリンス・オブ・ペルシャ 「プリンス・オブ・ペルシャ」など、 スプライトアニメーションを用意する必要がある場合、 必然的にこういった制御となる。 (プリンスオブペルシャ、1989年)

Slide 23

Slide 23 text

3Dゲームの中のAI Halo (HALO、バンジー、2001年) デバッグ画面 The Illusion of Intelligence - Bungie.net Downloads http://downloads.bungie.net/presentations/gdc02_jaime_griesemer.ppt

Slide 24

Slide 24 text

MIT • http://characters.media.mit.edu/projects/duncan.html

Slide 25

Slide 25 text

強化学習(例) 強化学習 (例)格闘ゲーム キック パン チ 波動 R_0 : 報酬=ダメージ http://piposozai.blog76.fc2.com/ http://dear-croa.d.dooo.jp/download/illust.html

Slide 26

Slide 26 text

強化学習 (例)格闘ゲームTaoFeng におけるキャラクター学習 Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx Microsoft Research Playing Machines: Machine Learning Applications in Computer Games http://research.microsoft.com/en-us/projects/mlgames2008/ Video Games and Artificial Intelligence http://research.microsoft.com/en-us/projects/ijcaiigames/

Slide 27

Slide 27 text

No content

Slide 28

Slide 28 text

No content

Slide 29

Slide 29 text

サブサンプション・アーキテクチャ(ロドニー・ブルックス) INPUT OUTPUT 時間 情報抽象度 反射的に行動 少し場合ごとに対応 抽象的に思考 理論的に考える 言語化のプロセス = 自意識の構築化 Subsumpution Architecture 運動の実現のプロセス = 身体運動の生成

Slide 30

Slide 30 text

機能環 効果器 受容器(刺激→興奮(記号)) 客体 活動神経網 知覚神経網 前野佳彦訳・ユクスキュル「動物の環境と内的世界」 (みすず書房) 知覚世界 活動世界 知覚微表担体 対象化された機構 活動担体 内的世界 興奮(記号) 興奮 興奮 運動形態 =特定の筋肉を動かす 中枢神経網

Slide 31

Slide 31 text

Physical Informat ion Abstract Informat ion More Abstract Informat ion Abstraction Time Decision-Making Decision-Making Decision-Making Multi-Layered Blackboard Abstraction Abstraction Reduction Reduction Reduction World World Dynamics Artificial Intelligence Object Object image on the lowest layer (Umwelt) Object image on the second layer Object image on the third layer Decision-Making Object image on the top layer

Slide 32

Slide 32 text

年 企業 テーマ 開発環境公開 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 33

Slide 33 text

強化学習

Slide 34

Slide 34 text

Early in the learning process … … after 15 minutes of learning Reward for decrease in Wulong Goth’s health Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx

Slide 35

Slide 35 text

Early in the learning process … … after 15 minutes of learning Punishment for decrease in either player’s health Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx

Slide 36

Slide 36 text

Hopper Training Hopper Trained

Slide 37

Slide 37 text

Ralf Herbrich, Thore Graepel Applied Games Group Microsoft Research Cambridge Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" https://www.slideserve.com/liam/forza-halo-xbox-live-the-magic-of- research-in-microsoft-products

Slide 38

Slide 38 text

 Real time racing simulation.  Goal: as fast lap times as possible.

Slide 39

Slide 39 text

Laser Range Finder Measurements as Features Progress along Track as Reward

Slide 40

Slide 40 text

機械学習 (例)FORZA MOTORSPORT におけるドライビング学習 Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx

Slide 41

Slide 41 text

機械学習 (例)FORZA MOTORSPORT におけるドライビング学習 Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx

Slide 42

Slide 42 text

機械学習 (例)FORZA MOTORSPORT におけるドライビング学習 • 揺らぎ • ライン – コーナーやそのコンビネーションに対し て、どれぐらいスムーズに車をガイドするか。 • コーナーへの突入スピードとブレーキを踏むタイ ミングと。保守的か過激か。 • コーナーの頂点にどれぐらい近づくか、どれぐら いの速度でそこを抜けるか? • コーナーを抜ける時のスピードとコーナーを回る 時のスピード。 Drivatar がプレイヤーのコントロールから学習するもの Microsoft Research Drivatar™ in Forza Motorsport http://research.microsoft.com/en-us/projects/drivatar/forza.aspx

Slide 43

Slide 43 text

機械学習 (例)FORZA MOTORSPORT におけるドライビング学習 Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx プレイヤーの特性を解析する 特徴となる数値をドライブモデルに渡す

Slide 44

Slide 44 text

機械学習 (例)FORZA MOTORSPORT におけるドライビング学習 Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx レーシングラインを事前に構築する。生成というよりテーブルから組み合わせる。

Slide 45

Slide 45 text

機械学習 (例)FORZA MOTORSPORT におけるドライビング学習 Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx レーシングラインを事前に構築する。生成というよりテーブルから組み合わせる。

Slide 46

Slide 46 text

機械学習 (例)FORZA MOTORSPORT におけるドライビング学習 Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx レーシングラインに沿わせるのではなく、理想とする位置とスピードから コントローラーの制御を計算して、物理制御によって車を運転する。

Slide 47

Slide 47 text

Forza motorsports (EA) Jeffrey Schlimmer, "Drivatar and Machine Learning Racing Skills in the Forza Series" http://archives.nucl.ai/recording/drivatar-and-machine-learning-racing-skills-in-the-forza-series/

Slide 48

Slide 48 text

Drivatar (Microsoft, Forza Motorsport) How Forza's Drivatar Actually Works | AI and Games #60 https://www.youtube.com/watch?v=JeYP9eyIl4E

Slide 49

Slide 49 text

DQNを有名にした 「AlphaGO」

Slide 50

Slide 50 text

年 企業 テーマ 開発環境公開 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 51

Slide 51 text

DQN (Deep Q network)とは

Slide 52

Slide 52 text

Deep Q Learning (深層強化学習) Q-Learning × Deep Learning

Slide 53

Slide 53 text

Q-Learning とは • Q = 期待される報酬 (意思決定関数) • S = State (座標、速度、現在の姿勢) • A = Action (キック、パンチ、波動拳) • R = 報酬 • Q (s,a ) という関数を決める方法

Slide 54

Slide 54 text

世界 五感 身体 言語 知識表 現型 知識 生成 Knowledge Making 意思決定 Decision Making 身体 運動 生成 Motion Making インフォメーション・フロー(情報回廊) 記憶 キャラクターにおける学習の原理 行動の表現 結果の表現 意思決定 Q(s,a) 関数

Slide 55

Slide 55 text

Deep Q Network (DQN)とは • Q = 予想される報酬 (意思決定関数) • S = State (座標、速度、現在の姿勢) • A = Action (キック、パンチ、波動拳) • R = 報酬 • Q (s,a ) という関数を決める方法 深層ニューラルネットワーク Deep Q Network

Slide 56

Slide 56 text

世界 五感 身体 言語 知識表 現型 知識 生成 Knowledge Making 意思決定 Decision Making 身体 運動 生成 Motion Making インフォメーション・フロー(情報回廊) 記憶 キャラクターにおける学習の原理 行動の表現 状態・結果の表現 意思決定 ニューラル ネットワーク (DQN)

Slide 57

Slide 57 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 58

Slide 58 text

Deep Q-Learning (2013) Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller (DeepMind Technologies) Playing Atari with Deep Reinforcement Learning http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf 画面を入力 操作はあらかじめ教える スコアによる強化学習

Slide 59

Slide 59 text

学習過程解析 Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller (DeepMind Technologies) Playing Atari with Deep Reinforcement Learning http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

Slide 60

Slide 60 text

AlphaGO 膨大な棋譜のデータ (人間では多過ぎて 読めない) この棋譜を そっくり打てる ように学習する 自己対戦して 棋譜を貯める この棋譜を そっくり打てる ように学習する AlphaGO

Slide 61

Slide 61 text

• Pπ ロールアウトポリシー(ロールアウトで討つ手を決める。 Pπ(a|s) sという状態でaを討つ確率) • Pσ Supervised Learning Network プロの討つ手からその 手を討つ確率を決める。Pσ(a|s)sという状態でaを討つ確 率。 • Pρ 強化学習ネットワーク。Pρ(学習済み)に初期化。 • Vθ(s’) 局面の状態 S’ を見たときに、勝敗の確率を予測 する関数。つまり、勝つか、負けるかを返します。 Mastering the game of Go with deep neural networks and tree search http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html https://deepmind.com/research/alphago/

Slide 62

Slide 62 text

囲碁AI: 位置評価関数から位置評価ニューラルネットワークへ Mastering the game of Go with deep neural networks and tree search http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html https://deepmind.com/research/alphago/ S Q R

Slide 63

Slide 63 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 64

Slide 64 text

Deep Mind社 「Agent 57」 • Atariの古典的なゲーム57個を人間よりうまくプレイできるよう になった Deep Mind社のAI • https://deepmind.com/blog/article/Agent57-Outperforming- the-human-Atari-benchmark

Slide 65

Slide 65 text

DQNのさらなる発展 • 最後までスコアに苦しんだゲーム • Montezuma’s Revenge • Pitfall • Solaris • Skiing Agent57: Outperforming the human Atari benchmark (DeepMind) https://deepmind.com/blog/article/Agent57-Outperforming-the-human-Atari-benchmark

Slide 66

Slide 66 text

Montezuma’s Revenge BootDQN + Randomized Prior playing Montezuma's Revenge https://www.youtube.com/watch?v=pqkM1PrIOyI

Slide 67

Slide 67 text

Solaris Agent57 playing Solaris (Google DeepMind) https://www.youtube.com/watch?v=QDb3rmEBTZI

Slide 68

Slide 68 text

Pitfall! NGU playing Pitfall! (Google DeepMind) https://www.youtube.com/watch?v=imAeLt1BPu4

Slide 69

Slide 69 text

Skiing NGU playing Skiing (Google DeepMind) https://www.youtube.com/watch?v=0_67wNXyOcI

Slide 70

Slide 70 text

OpenAI「HIDE AND SEEK」 による学習 (2019年)

Slide 71

Slide 71 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 72

Slide 72 text

「かくれんぼ」によってマルチエージェ ントを学習させる • オブジェクトがあって、動かしたり固 定したりできる。 • オブジェクトは直方体、傾斜台、長い 板がある。 • 一度固定したオブジェトは動かせない • エージェントは次第にオブジェクトを 利用してかくれんぼをするようになる • 6種類の戦術を順番に発見・学習して いく https://openai.com/blog/emergent-tool-use/ Emergent Tool Use From Multi-Agent Autocurricula (2019) Bowen Baker, Ingmar Kanitscheider, Todor Markov, Yi Wu, Glenn Powell, Bob McGrew, Igor Mordatch https://arxiv.org/abs/1909.07528

Slide 73

Slide 73 text

https://www.youtube.com/watch?v=kopoLzvh5jY

Slide 74

Slide 74 text

意思決定 スパーシャル AI モーション クエリー 返答 報告 ボディ層 (身体層) 環境 センサー センサー センサー 静的・動的解析 状態指定 報告 メタAI クエリー 返答 タスク (命令) ゲームプレイ結果報告 ナビゲー ションAI モーション 指定 キャラクターAI 自動生成 プロシージャル技術 ゲームプレイ

Slide 75

Slide 75 text

デジタルゲームの人工知能における イノベーションのポイント③ 「スパーシャルAI」 (もっとも地味な技術がすべてを変える)

Slide 76

Slide 76 text

デジタルゲームAI入門② (スパーシャルAI)

Slide 77

Slide 77 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル

Slide 78

Slide 78 text

ネットワーク上のグラフ検索法 A*法 M F L B A S O P D C G S V H Q X K N J R T W E I U Z Y G 5 4 6 3 7 2 3 B C 3 3 2 2 4 3 5 5 出発点(S)を中心に、そのノードまでの 最も短い経路を形成して行く。Gにたどり着いたら終了。 ゴール地点がわかっている場合、現在のノードとゴールとの推定距離(ヒューリスティック距離) を想定して、トータル距離を取り、それが最少のノードを探索して行く。 各ノードの評価距離=出発点からの経路+ヒューリスティック距離 ヒューリスティック距離 (普通ユークリッド距離を取る) 3+14.2 3+13.8 G H 3 5+10.5 6+8.4

Slide 79

Slide 79 text

パス検索(デモと実例)

Slide 80

Slide 80 text

パス検索がもたらしたイノベーション • キャラクターを一定の区域から解放した • キャラクターを動かしたゲームデザインを可能にした • キャラクターに長期的な思考を必要とさせた • ゲームをステージ制からオープンワールドへと引き上げた

Slide 81

Slide 81 text

(メッシュ) コスト : 0.5 見通し: 1.0 地表: 土 (メッシュ) コスト : 0.8 見通し: 0.7 地表: 沼 (オブジェクト) 動かせる : (1.0,0.8)向き 持ち上げる: false 上に乗れる: false 硬さ: 0.9 重たさ: 0.4 (オブジェクト) アクション:レバー倒す 効果: 扉が開く (オブジェクト)扉 メッシュ同士の リンク情報

Slide 82

Slide 82 text

スパーシャルAI 空間解析 状況解析 位置検索技術 パス検索 スマートオブジェクト など多数 影響マップ など多数

Slide 83

Slide 83 text

プレイヤー予測経路(ゴールデンパス) M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 84

Slide 84 text

ゴールデンパスに沿った位置検索技術 プレイヤーの 予想目標地点 プレイヤーの現在位置 ゴールデンパス ゴールデンパス上で、20m以上プレイヤーから離れて、 40m以内にある場所で、ゴールデンパスから幅10mの領域でポイントを見つける

Slide 85

Slide 85 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 86

Slide 86 text

Tom Mathews Making "Big Data" Work for 'Halo': A Case Study http://ai-wiki/wiki/images/d/d8/AI_Seminar_177th.pdf

Slide 87

Slide 87 text

位置検索システム

Slide 88

Slide 88 text

位置検索システム - キャラクターの性能に応じて - 地形毎に - リアルタイムで 最も適したポイントを見つけるシステム

Slide 89

Slide 89 text

Enemy Friend NPC Rock Rock Sea Hole

Slide 90

Slide 90 text

No content

Slide 91

Slide 91 text

No content

Slide 92

Slide 92 text

No content

Slide 93

Slide 93 text

No content

Slide 94

Slide 94 text

No content

Slide 95

Slide 95 text

No content

Slide 96

Slide 96 text

No content

Slide 97

Slide 97 text

No content

Slide 98

Slide 98 text

オリジナル

Slide 99

Slide 99 text

オリジナル

Slide 100

Slide 100 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 101

Slide 101 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 102

Slide 102 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 103

Slide 103 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 104

Slide 104 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 105

Slide 105 text

車に空間感覚を与える • 車自体がセンサーだけではなく、空間認識能力を持つ • ドライビング以外にも、さまざまな空間的感覚を手に入れる。

Slide 106

Slide 106 text

スパーシャルAI 空間解析 状況解析 位置検索技術 パス検索 スマートオブジェクト など多数 影響マップ など多数

Slide 107

Slide 107 text

スマートオブジェクト、スマートロケーション 物の方に人工知能を持たせて、物からキャラクターを操る仕組み

Slide 108

Slide 108 text

物理的都市空間 スマートスペース メタバース

Slide 109

Slide 109 text

デジタルゲームの人工知能における イノベーションのポイント④ 「メタAI」 (必然?偶然?)

Slide 110

Slide 110 text

デジタルゲームAI入門③ (メタAI)

Slide 111

Slide 111 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル

Slide 112

Slide 112 text

メタAIの歴史 1980 1990 2000 古典的メタAI 現代のメタAI キャラクターAI技術の発展 その歴史は古く、1980年代にまでさかのぼる。 その時代と現代のメタAIは、異なる点も多いので、 古典的メタAI、現代のメタAIと名づけて区別することにしよう。

Slide 113

Slide 113 text

(例)「ゼビウス」(ナムコ、1983) 敵出現テーブル巻き戻し 敵0 敵1 敵2 敵3 敵4 敵5 『あと面白い機能なんですけれど、 ゼビウスには非常に簡単なAIが組み込まれています。 「プレイヤーがどれくらいの腕か」というのを判断して、 出てくる敵が強くなるんです。 強いと思った相手には強い敵が出てきて、 弱いと思った相手には弱い敵が出てきます。 そういっ たプログラムが組み込まれています。 ゲームの難易度というのは「初心者には難しくて、上級者 には簡単だ」ということが、 ひとつの難易度で(調整を)やっていくと起きてしまうので、 その辺を何 とか改善したいな、ということでそういったことを始めてみたのですけれど、 お陰で割合にあまり上 手くない人でも比較的長くプレイできる、 うまい人でも最後のほうに行くまで結構ドラマチックに楽 しめる、 そういった感じになっています。』 - 遠藤雅伸(出演)、1987、「糸井重里の電視遊戯大展覧会」『遠藤雅伸ゼビウスセミナー』フジテレビ -

Slide 114

Slide 114 text

メタAIの歴史 1980 1990 2000 古典的メタAI 現代のメタAI キャラクターAI技術の発展 その歴史は古く、1980年代にまでさかのぼる。 その時代と現代のメタAIは、異なる点も多いので、 古典的メタAI、現代のメタAIと名づけて区別することにしよう。

Slide 115

Slide 115 text

メタAI(=AI Director)によるユーザーのリラックス度に応じた敵出現度 ユーザーの緊張度 実際の敵出現数 計算によって 求められた 理想的な敵出現数 Build Up …プレイヤーの緊張度が目標値を超えるまで 敵を出現させ続ける。 Sustain Peak … 緊張度のピークを3-5秒維持するために、 敵の数を維持する。 Peak Fade … 敵の数を最小限へ減少していく。 Relax … プレイヤーたちが安全な領域へ行くまで、30-45秒間、 敵の出現を最小限に維持する。 Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford. http://www.valvesoftware.com/publications.html より具体的なアルゴリズム

Slide 116

Slide 116 text

安全な領域までの道のり(Flow Distance) メタAIはプレイヤー群の経路を トレースし予測する。 - どこへ来るか - どこが背面になるか - どこに向かうか Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford. http://www.valvesoftware.com/publications.html

Slide 117

Slide 117 text

プレイヤーからの可視領域 可視領域(プレイヤーから見えている 部屋)では、敵のスパウニング(発生) はできない。 Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford. http://www.valvesoftware.com/publications.html

Slide 118

Slide 118 text

敵出現領域 背後 前方 Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford. http://www.valvesoftware.com/publications.html 前方と背後のプレイヤー群から見えてない部屋に、 モンスターを発生させる。

Slide 119

Slide 119 text

Procedural Generation in WarFrame • Warframe ではダンジョンが自動生成される。 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 120

Slide 120 text

Black Combination in WarFrame • ブロックを組み合わる • 完全に零からの生成 ではない。 このような生成のことを Semi-procedural と言う。 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 121

Slide 121 text

WarFrame における自動生成マップの 自動解析による自動骨格抽出 • 自動生成するだけでなく、自動生成したダンジョンを、自動解 析します。ここでは、トポロジー(形状)検出を行います。

Slide 122

Slide 122 text

WarFrame における自動生成マップの 自動解析によるナビゲーションデータ作成 抽出した骨格に沿って 自動的にナビゲーション・データを作成します。 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 123

Slide 123 text

スタートポイント、出口、目的地の 自動生成 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 124

Slide 124 text

ヒートマップ(影響マップ)を用いて ゲーム中にプレイヤーの周囲を自動解析 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed ヒートマップ(影響マップ)とは、対象(ここではプレイヤー)を中心に、位置に温度(影響度)を 与える方法です。距離に応じて減衰します。また時間が経つと、周囲に熱が拡散します。

Slide 125

Slide 125 text

Tactical Map の例 (影響マップ) (例)敵と自分の勢力をリアルタイムに計算する。 4 6 8 8 8 8 6 4 2 0 -1 -2 -4 -4 -4 -2 4 6 8 8 8 8 4 2 1 0 -2 -4 -4 -2 4 6 8 8 8 6 3 1 0 -2 -4 -4 -4 -2 4 6 8 8 8 6 6 4 1 0 -2 -4 -4 -2 2 4 6 8 6 6 4 4 0 -1 -2 -4 -4 -4 -2 1 2 4 6 6 4 2 2 -4 -5 -3 -3 -4 -4 -2 -1 3 3 3 3 4 2 2 0 -4 -5 -5 -8 -8 -6 -4 -2 3 3 2 2 2 0 -2 -4 -8 -10 -10 -8 -4 -2 3 3 3 2 2 1 0 -4 -8 -10 -10 -8 -8 -4 -2 2 2 2 2 1 1 0 -3 -8 -10 -10 -8 -8 -4 -2 1 1 1 1 0 0 -2 -4 -8 -8 -8 -8 -8 -8 -8 -8 0 0 0 0 0 -1 -1 -2 -5 -6 -6 -6 -8 -8 -8 0 0 0 0 -1 -2 -2 -2 -4 -4 -4 -6 -8 -8 -8 -8 0 0 0 0 -1 -2 -2 -2 -2 -2 -2 -2 -2 -2 -2 0 0 0 0 -1 -2 -2 -2 -2 -2 -2 -2 -2 -2 -2 -2 0 0 0 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1

Slide 126

Slide 126 text

ヒートマップ(影響マップ)を用いて ゲーム中にプレイヤーの周囲を自動解析 「ヒートが増加する=プレイヤーが近づく点」 「ヒートが減少する=プレイヤーが遠ざかる点」 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 127

Slide 127 text

アクティブ・エリアセット(Active Are Set) Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed アクティブ・エリアセットは、プレイヤーの周囲の領域で、 リアルタイムにメタAIがゲームを調整する領域

Slide 128

Slide 128 text

メタAIがアクティブ・エリアセット内で ゲームを調整する 「ヒートが増加する=プレイヤーが近づく点」なので、モンスターを生成する。 「ヒートが減少する=プレイヤーが遠ざかる点」なので、モンスターを停止する。 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 129

Slide 129 text

技術の変わり目 ビックデータ x ディープラーニング シミュレーション x ディープラーニング データが貯まるところでディープラーニングを行い特徴抽出を行う シミュレーションでデータを貯めてディープラーニングを行う

Slide 130

Slide 130 text

ゲームとディープラーニング 現状 • この3年間で、ゲーム産業以外で、ゲームを用いたディープ ラーニングの研究が増加している。 • 当のゲーム産業では、それ程多くない。 理由 • 強化学習(DQNなど)を研究するには、結局ルールを持つシ ミュレーション空間を使う必要がある。 • データがないところでディープラーニングを活用したい • 現実空間で応用する前に箱庭で成長させたい • ほとんどすべて研究環境がオープンソースになっている。

Slide 131

Slide 131 text

シミュレー ション これからの人工知能のフレームワーク 現実 機械学習 (ディープ ラーニン グ) この2つの技術の結びつきが、現実においても、仮想 空間においても、これからの協力な技術コアとなる。

Slide 132

Slide 132 text

ビックデータ x ディープラーニング から シミュレーション x ディープラーニング へ

Slide 133

Slide 133 text

シミュレーション 現実 機械学習 (ディープ ラーニン グ) DeepMind社「Capture the flag」による ディープラーニング学習 https://deepmind.com/blog/article/capture-the-flag-science

Slide 134

Slide 134 text

Google 「サッカーシミュレーター」による強化学習の 研究 https://automaton-media.com/articles/newsjp/20190613-95002/ シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://ai.googleblog.com/2019/06/introducing-google-research-football.html https://www.youtube.com/watch?v=F8DcgFDT9sc&t=4s

Slide 135

Slide 135 text

Microsoft 「AirSim」による強化学習の研究 シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://microsoft.github.io/AirSim/ https://www.youtube.com/watch?v=-WfTr1-OBGQ&t=9s

Slide 136

Slide 136 text

Nvidia「ドライビングシミュレーター」による強化学習 の研究 シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://www.nvidia.com/en-us/self-driving-cars/drive-constellation Neural Reconstruction Engine in NVIDIA DRIVE Sim (NVIDIA) https://www.youtube.com/watch?v=vgot-CK1xRk&t=5s

Slide 137

Slide 137 text

シミュレー ション これからの人工知能のフレームワーク 現実 機械学習 (ディープ ラーニン グ) この2つの技術の結びつきが、現実においても、仮想 空間においても、これからの協力な技術コアとなる。

Slide 138

Slide 138 text

現実世界 デジタル ツイン 相互作用 ミラーワールド スマートシティ センシング AIによる干渉 With ディープラーニング

Slide 139

Slide 139 text

現実世界 デジタル ツイン 相互作用 ミラーワールド スマートシティ センシング AIによる干渉 With ディープラーニング コモングラウンド

Slide 140

Slide 140 text

シム空間とリアル空間を行き来する車 • リアルな存在であると同時に、デジタル空間の存在でもある。 • 二重性を持つ。 • 夢を見る車=昼間は知ったコースを反芻してイメージする

Slide 141

Slide 141 text

現実世界 デジタル ツイン 相互作用 ミラーワールド スマートシティ センシング AIによる干渉 With ディープラーニング

Slide 142

Slide 142 text

現実世界 現実世界 センサー エフェクタ デジタル ツイン 意思決定・ シミュレーション ゲームエンジン 都市のエージェントの エージェント・ アーキテクチャ 情報経路

Slide 143

Slide 143 text

現実世界 現実世界 センサー エフェクタ デジタル ツイン × 世界モデル (ディープ ラーニング) 都市の 世界モデルの獲得 世界モデル シミュレーション 意思決定 都市の夢を見る シミュレーション エンジン 都市メタAIの エージェント・ アーキテクチャ 情報経路

Slide 144

Slide 144 text

デジタルゲームのイノベーション 「ゲームエンジン」 (技術集積場)

Slide 145

Slide 145 text

ゲームエンジン

Slide 146

Slide 146 text

現実世界 メタバース (ゲーム エンジン) 物理法則 化学法則 経済法則 社会法則 生物法則 知能の法則 抽出 実装 物理シミュレーション 化学シミュレーション 経済シミュレーション 社会シミュレーション 生物シミュレーション 知能シミュレーション シミュレーション化 サイエンス・エンジニアリング 情報処理 物・運動 データ構造・プログラム

Slide 147

Slide 147 text

現実世界 デジタル ツイン (ゲーム エンジン) 相互作用 ミラーワールド スマートシティ センシング AIによる干渉

Slide 148

Slide 148 text

風 頂点 ポリゴン 頂点 移動計算 移動計算 メモリ CPU or GPU 変 更 アーティスト エンジニア ロード (格納) 実行

Slide 149

Slide 149 text

ゲームエンジンの時代 • ゲームエンジンは古くからある(80年代、ナムコのタスクシステム) • ゲームの規模が小さいうちは効果が大きくない • 90年代(ほとんどない。ソースコードレベル) • 00年代(黎明期) • ゲームエンジン群雄割拠時代(2010-2020) • 市販のエンジンに加えて、それぞれのゲーム会社でゲームエンジンが作られた • 現代では、ゲームエンジンなしで大型ゲームは作れない • ゲームエンジン=ゲームの質に直結、ゲーム開発の技術を集積する場所 • Unreal Engine(Epic)とUnity3Dが生き残った • Unreal Engine アメリカ 巨漢大砲主義の思想 • Unity 3D デンマーク(北欧)Do it yourself の思想

Slide 150

Slide 150 text

ジョブ・コントローラー(ナムコ、ゼビウスなど) 三宅 陽一郎 「タスクシステムの起源について」 2016年 年次大会 予稿集

Slide 151

Slide 151 text

大型ゲームエンジン一覧(他にもたくさん) タイトル ゲームエンジン名 会社 Far Cry 3,4 DUNIA ENGINE 2 Ubisoft Montreal THE DIVISION snow drop engine Ubisoft (massive) Assassin’s creed: syndicate AnvilNext 2.0 game engine Ubisoft Montreal For Honor AnvilNext 2.0 game engine Ubisoft Montreal Rise of Tomb Raider Foundation engine Crystal Dynamics The Witcher 3 RED ENGINE CD PROJEKT Dragon Age : Inquisition frostbite engine EA DICE ゲームエンジン名 会社 汎用型 Unity3D Unity Technologies (デンマーク) 汎用型 UNREAL ENGINE 4 Epic Games (米) 汎用型 CryEngine CryTech (独) 汎用型 Lumberyard Amazon 汎用型 Stingray Autodesk

Slide 152

Slide 152 text

メタバース 物・運動 データ構造・プログラム 現実世界 ツールで アーティスト・ デザイナーが 作成 エンジニアが プログラミング 存在 法則

Slide 153

Slide 153 text

原子 分子=原子+力 物質=分子と力 現象=物質と力 データ オブジェクト =データ+プロ エンティティ =オブジェクト 現象 =エンティティ+ 現実世界 メタバース

Slide 154

Slide 154 text

データ処理 オブジェクト =データ+プログラム エンティティ =オブジェクトとプログラム 現象 =エンティティ+プログラム メタバース 情報処理基礎 (プログラミング基礎) オブジェクト指向 プログラミング 大規模システム プログラミング シミュレーション プログラミング

Slide 155

Slide 155 text

https://www.moguravr.com/virtual-shibuya-8/

Slide 156

Slide 156 text

https://www.youtube.com/watch?v=1FOz5dMxn3s

Slide 157

Slide 157 text

ビックデータ x ディープラーニング から シミュレーション x ディープラーニング へ

Slide 158

Slide 158 text

ゲームの中、ゲームの外 ゲーム周辺AI (外=開発、現実) ゲームAI (中=コンテンツ) メタAI キャラクター AI ナビゲーション AI 開発支援 AI QA-AI 自動バランス AI インターフェース 上のAI データ マイニング シミュレーショ ン技術 ゲーム 可視化 ユーザーの 生体信号 プロシー ジャルAI

Slide 159

Slide 159 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル

Slide 160

Slide 160 text

人工知能全域 機械学習 ディープ ラーニング 統計 学習 コネクショニズム シンボリズム デジタルゲームAI ゲームAIはシンボリックAIから機械学習へ 今後10年かけて徐々にシフトする 現在、社内でも研究中。

Slide 161

Slide 161 text

人工知能全域 機械学習 ディープ ラーニング 統計 学習 コネクショニズム シンボリズム デジタルゲームAI ゲームAIはシンボリックAIから機械学習へ 今後10年かけて徐々にシフトする 現在、社内でも研究中。

Slide 162

Slide 162 text

人工知能全域 機械学習 ディープ ラーニング 統計 学習 コネクショニズム シンボリズム デジタルゲームAI 機械学習の導入には土台となるシミュレーション (物理、仕組み)が必要 シミュレーション技術

Slide 163

Slide 163 text

ジェネレーティブAI

Slide 164

Slide 164 text

意思決定 スパーシャル AI モーション クエリー 返答 報告 ボディ層 (身体層) 環境 センサー センサー センサー 静的・動的解析 状態指定 報告 メタAI クエリー 返答 タスク (命令) ゲームプレイ結果報告 ナビゲー ションAI モーション 指定 キャラクターAI 自動生成 プロシージャル技術 ゲームプレイ

Slide 165

Slide 165 text

プロシージャル技術 ゲームAI技術 AI技術 プロシージャル 技術 コンテンツ自動生成技術 (PCG, Procedural Contents Generation )

Slide 166

Slide 166 text

Rogue (1980)のレベル生成法 Rect[0] Rect[0] Rect[1] Rect[0] Rect[1] Rect[2] Rect[3] http://racanhack.sourceforge.jp/rhdoc/intromaze.html

Slide 167

Slide 167 text

Rogue (1980)のダンジョン生成法 Rect[0] Rect[0] Rect[1] Rect[0] Rect[1] Rect[2] Rect[3] このようにアセット(ゲームのデータ)をツールなどを通して製作するのではなく、 プログラムで作ることを「プロシージャル・コンテンツ・ジェネレーション」(PCG)と言う。 http://racanhack.sourceforge.jp/rhdoc/intromaze.html

Slide 168

Slide 168 text

プロシージャル技術(自動生成技術) ゲーム内の自動生成技術は、メタAIに属する技術

Slide 169

Slide 169 text

ブラウン運動から地形生成 ロバート・ブラウン博士によって、1827年に発見された現象。 微粒が媒質(液体)の中で行う不規則な運動。 アインシュタイン博士によって、熱運動する媒質の不規則な 衝突によって引き起こされると説明された。 http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95 宮田一乗「プロシージャル技術の動向」(CEDEC 2008)

Slide 170

Slide 170 text

ブラウン運動から地形生成 (1987) http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95 http://www.kenmusgrave.com

Slide 171

Slide 171 text

ブラウン運動から地形生成 (1987) http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95 http://www.kenmusgrave.com

Slide 172

Slide 172 text

NO MAN’S SKY (Hello Games, 2016) http://www.no-mans-sky.com/ 宇宙、星系、太陽系、惑星を自動生成する。

Slide 173

Slide 173 text

FarCry2 (Dunia Engine ) デモ 草原自動生成 時間システム 樹木自動生成 動的天候システム 動的天候システム http://www.farcry2-hq.com/downloads,18,dunia-engine-nr1.htm

Slide 174

Slide 174 text

Far Cry 2 Dunia Engine - Growing Vegetation (Far Cry HQ) https://www.youtube.com/watch?v=FI3oR6vqn1Q

Slide 175

Slide 175 text

ブラウン運動 ロバート・ブラウン博士によって、1827年に発見された現象。 微粒が媒質(液体)の中で行う不規則な運動。 アインシュタイン博士によって、熱運動する媒質の不規則な 衝突によって引き起こされると説明された。 http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95

Slide 176

Slide 176 text

地形自動生成 Jacob Olsen, Realtime Procedural Terrain Generation http://oddlabs.com/download/terrain_generation.pdf 2次元中点変位法 ボロノイ図 ノイズ法(濃い=低い、白い=高い) + =

Slide 177

Slide 177 text

Ken Musgrave http://www.kenmusgrave.com/

Slide 178

Slide 178 text

Terragen(Planetside Software) 風景、自動生成生成ソフト http://www.planetside.co.uk/terragen/ 海外のゲームや映画の背景として利用されている

Slide 179

Slide 179 text

Age of Empires III における地形自動生成 西川善司, 「3DゲームファンのためのAGE OF EMPIRESエンジン講座(後編)こだわりの影生成と算術合成 されるディテール、次回作はXbox2?」, GAME Watch, 2005

Slide 180

Slide 180 text

L-system による街の自動生成 City Engine(central pictures) Yoav I H Parish, Pascal Müller http://www.centralpictures.com/ce/tp/paper.pdf http://www.centralpictures.com/ce/ George Kelly, Hugh McCabe, A Survey of Procedural Techniques for City Generation http://www.gamesitb.com/SurveyProcedural.pdf

Slide 181

Slide 181 text

https://www.youtube.com/watch?v=NfizT369g60

Slide 182

Slide 182 text

https://www.youtube.com/watch?v=FzoY062kY1s

Slide 183

Slide 183 text

アメリカ大陸のデータから地形生成(Eidos) https://www.eidosmontreal.com/news/worldgen-painting-the-world-one-layer-at-a-time/

Slide 184

Slide 184 text

L-system による街の自動生成 City Engine(central pictures) Yoav I H Parish, Pascal Müller http://www.centralpictures.com/ce/tp/paper.pdf http://www.centralpictures.com/ce/ George Kelly, Hugh McCabe, A Survey of Procedural Techniques for City Generation http://www.gamesitb.com/SurveyProcedural.pdf

Slide 185

Slide 185 text

VITRUVIO CityEngine Plugin for Unreal Engine https://esri.github.io/cityengine/vitruvio

Slide 186

Slide 186 text

SimCity 4 Engine, Glassbox https://www.youtube.com/watch?v=tKOgo7EFl_w

Slide 187

Slide 187 text

ゲーム自動生成 [参考文献] Cameron Browne,“Evolutionary Game Design”, SpringerBriefs in Computer Science, 2011

Slide 188

Slide 188 text

ゲーム自動生成 [参考文献] Cameron Browne,“Evolutionary Game Design”, SpringerBriefs in Computer Science, 2011

Slide 189

Slide 189 text

ゲーム自動生成 [参考文献] Cameron Browne,“Evolutionary Game Design”, SpringerBriefs in Computer Science, 2011

Slide 190

Slide 190 text

評価 選 択 交叉 突然変異 ルール チェック 整合性 がある か? ポリシー 選択 速度が 遅い? ゴミ 箱 テストプ レイ 前と似て いる 引き分け になり やすい 母集団 Mark J. Nelson, “Bibliography: Encoding and generating videogame mechanics”, IEEE CIG 2012 tutorial URL https://www.kmjn.org/notes/generating_mechanics_bibliography.html Cameron Browne,“Evolutionary Game Design”, SpringerBriefs in Computer Science, 2011 URL https://www.springer.com/jp/book/9781447121787

Slide 191

Slide 191 text

ゲーム自動生成 https://jellyjellycafe.com/games/yabalath

Slide 192

Slide 192 text

PCGML PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 193

Slide 193 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 194

Slide 194 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 195

Slide 195 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 196

Slide 196 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212 PCGRL参考 • https://twitter.com/togelius/status/1222038094507102208 • https://twitter.com/i/status/1222038094507102208

Slide 197

Slide 197 text

ゲームAI研究の新展開 • 2023/7/4 • オーム社 CHAPTER 1 ゲームと知能研究 CHAPTER 2 不完全情報ゲーム CHAPTER 3 不確定ゲーム CHAPTER 4 コミュニケーションゲーム CHAPTER 5 実環境のゲーム CHAPTER 6 ゲームデザイン CHAPTER 7 メタAIとプロシージャル コンテンツ ジェネレーション CHAPTER 8 人間らしさと楽しさの演出 CHAPTER 9 ゲーム体験の評価 CHAPTER 10 人間の認知機能とスキルアップの原理 CHAPTER 11 認知研究とAIの人間への影響 https://www.ohmsha.co.jp/book/9784274230776

Slide 198

Slide 198 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 199

Slide 199 text

https://medium.com/deepgamingai/game-level-design-with-reinforcement-learning-52b02bb94954

Slide 200

Slide 200 text

PCGRL参考 • https://twitter.com/togelius/status/1222038094507102208 • https://twitter.com/i/status/1222038094507102208

Slide 201

Slide 201 text

人間が製作し、 人工知能がチェックする Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 202

Slide 202 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 203

Slide 203 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 204

Slide 204 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 205

Slide 205 text

CoG 2021: Adversarial Reinforcement Learning for Procedural Content Generation SEED – Electronic Arts https://www.youtube.com/watch?v=kNj0qcc6Fpg

Slide 206

Slide 206 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 207

Slide 207 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 208

Slide 208 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 209

Slide 209 text

NUVERSE、GPT3をゲームに組み込む [GDC 2023]GPT-3でNPCの会話を生成。Nuverseが「アース:リバイバル」でチャレンジする,新テクノロ ジーによるゲーム開発の“新たな一歩” https://www.4gamer.net/games/651/G065105/20230325007/

Slide 210

Slide 210 text

Earth revival (Nuverse, 中国のゲーム) • 800ms以下で会話を生成 • アニメーション生成(10 から 20秒の) • …つまり20 時間のコンテンツをわずか48分で生成 • GPT3 • 音声生成 Nuverse lets AI do all the talking and moving of NPCs in Earth: Revival https://premortem.games/2023/03/22/nuverse-lets-ai-do-all- the-talking-and-moving-of-npcs-in-earth-revival/ ジェネレーティブAIでゲーム開発支援! GDCで発表されたリア ルな事例や取り組みを紹介 https://www.famitsu.com/news/202303/24297009.html

Slide 211

Slide 211 text

ChatGPT と Stable Diffusion を用いた RPG: Tales of Syn • How AI-assisted RPG Tales of Syn utilizes Stable Diffusion and ChatGPT to create assets and dialogues • https://gameworldobserver.com/2023/03/06/tales-of-syn-ai- rpg-stable-diffusion-chatgpt-game • Tales of Syn • https://talesofsyn.com/ • https://twitter.com/_hackmans_/status/1624501399383072768

Slide 212

Slide 212 text

ChatGPT と Stable Diffusion を用いた RPG: Tales of Syn • https://twitter.com/_hackmans_/status/1624501399383072768 • https://talesofsyn.com/

Slide 213

Slide 213 text

Tales of Syn Game - NPC Chat GPT3 Prototype (Tales of Syn) https://www.youtube.com/watch?v=ejw6OI4_lJw

Slide 214

Slide 214 text

はじめに

Slide 215

Slide 215 text

ゲームとディープラーニング 現状 • この3年間で、ゲーム産業以外で、ゲームを用いたディープ ラーニングの研究が増加している。 • 当のゲーム産業では、それ程多くない。 理由 • 強化学習(DQNなど)を研究するには、結局ルールを持つシ ミュレーション空間を使う必要がある。 • データがないところでディープラーニングを活用したい • 現実空間で応用する前に箱庭で成長させたい • ほとんどすべて研究環境がオープンソースになっている。

Slide 216

Slide 216 text

シミュレー ション これからの人工知能のフレームワーク 現実 機械学習 (ディープ ラーニン グ) この2つの技術の結びつきが、現実においても、仮想 空間においても、これからの協力な技術コアとなる。

Slide 217

Slide 217 text

ビックデータ x ディープラーニング から シミュレーション x ディープラーニング へ

Slide 218

Slide 218 text

Google 「サッカーシミュレーター」による 強化学習の研究 https://automaton-media.com/articles/newsjp/20190613-95002/ シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://ai.googleblog.com/2019/06/introducing-google-research-football.html

Slide 219

Slide 219 text

シミュレーション 現実 機械学習 (ディープ ラーニン グ) DeepMind社「Capture the flag」による ディープラーニング学習 https://deepmind.com/blog/article/capture-the-flag-science

Slide 220

Slide 220 text

AnyLogic「シミュレーションx機械学習」 サービス シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://www.anylogic.com/warehouse-operations/

Slide 221

Slide 221 text

Microsoft 「AirSim」による強化学習の研究 シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://microsoft.github.io/AirSim/

Slide 222

Slide 222 text

Nvidia「ドライビングシミュレーター」によ る強化学習の研究 シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://www.nvidia.com/en-us/self-driving-cars/drive-constellation

Slide 223

Slide 223 text

ブロックチェインとゲーム

Slide 224

Slide 224 text

Blockchain技術とは?

Slide 225

Slide 225 text

Blockchain技術とは? 生成の記録が記録される

Slide 226

Slide 226 text

Blockchain技術とは?

Slide 227

Slide 227 text

Blockchain技術とは? 交換の記録が記録される

Slide 228

Slide 228 text

No content

Slide 229

Slide 229 text

My Crypt Heroes • https://www.mycryptoheroes.net

Slide 230

Slide 230 text

https://onlinegame-pla.net/my-crypto-heroes/ https://www.doublejump.tokyo/pr/double_jump.tokyo_pr_20180621.pdf

Slide 231

Slide 231 text

https://www.coindesk.com/chinas-search-giant-baidu-tests-crypto-puppy-marketplace-on-blockchain/

Slide 232

Slide 232 text

• https://crypto-games.de/crypto-games-liste/ ドイツ語サイト

Slide 233

Slide 233 text

Ubisoft blockchain 主任のインタビュー • https://blockchaingamer.net/exclusive-interview-with-mr- nicolas-pouard-blockchain-initiative-manager-at-ubisoft/ • https://www.blockchaingamer.biz/news/5026/video-ubisoft- blockchain-games/

Slide 234

Slide 234 text

No content

Slide 235

Slide 235 text

自動生成して、 それを自動管理できる

Slide 236

Slide 236 text

ユーザーが作り出したものを公開すると、 それは他のユーザーのネットワーク上で 記録される。 それはUbiでさえ消去できない財産となる。 しかも、そういうことにUbiは 報酬を出す

Slide 237

Slide 237 text

ユーザーによる ユーザー自身のための ユーザーが所有する 世界を作り出すことができる

Slide 238

Slide 238 text

• https://www.youtube.com/watch?v=tdrrC6fhyRk • 35分ぐらいから

Slide 239

Slide 239 text

Ubisoft主催 第一回 BC Gaming Summit http://blockchaingamesummit.com/

Slide 240

Slide 240 text

第I部:デジタルゲームAI 第II部:メタバースとスマートシティ

Slide 241

Slide 241 text

メタバースとスマートシティにおける イノベーション

Slide 242

Slide 242 text

情報処理学会 7月号(電子) 人工知能学会誌 7月号

Slide 243

Slide 243 text

参考文献 • 三宅陽一郎 「デジタルゲームAI技術を応用したスマートシティの設計」 人工知能学会誌、37巻4号(2022年) 10ページ • 三宅陽一郎 • 「メタバースの成立と未来 ―新しい時間と空間の獲得へ向けて―」, 情報処理, Vol.63 No.7 (2022年) 34ページ https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=218538&item_no=1&page_id=13&block_id=8 https://www.jstage.jst.go.jp/article/jjsai/37/4/37_436/_article/-char/ja/

Slide 244

Slide 244 text

スマートシティ

Slide 245

Slide 245 text

データ収集 (DataSF, CityVerve) サービス https://www.softbank.jp/biz/blog/business/articles/202003/overseas-smart-city/

Slide 246

Slide 246 text

スマートシティの全体設計

Slide 247

Slide 247 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル(三宅,2020)

Slide 248

Slide 248 text

都市全体の知能(意識) 交通全般を制御するAI 各エリアを 監視・制御するAI 各ビルを監視・ 制御するAI 道路を 監視・制御 するAI 各広場を 監視・制御 するAI 人の流れを 監視・制御 するAI 抑止・委任 報告 抑止・委任 報告 監視 制御 人 ドローン ロボット デジタル アバター 報告 命令 人 監視 制御 監視 制御 協調 協調 協調・ 命令 監視 制御 デ ジ タ ル ツ イ ン / メ タ バ ス / 世 界 モ デ ル 都 市 キャラクターAI ス パ | シ ャ ル AI メタAI 空 間 記 述 表 現 協調 協調

Slide 249

Slide 249 text

都市 環境アクターネットワーク 人工知能 (メタAI, キャラクターAI, スパーシャルAI) 都市の人工知能システム 都市の実体(物質、仕組み、ネットワーク構造)

Slide 250

Slide 250 text

都市のアクター ネットワーク 物理的な都市 都市の 人工知能 都市の 意識 (都市の無意識) (都市の身体)

Slide 251

Slide 251 text

都市を囲う環境世界 命令の 構成 世界モデル 世界シミュレーション 都市のセンサー群 都市のアクター群 スパー シャルAI 認識の 形成 意思の 決定 都市のエージェント群 メタAI (都市の人工知能) キャラクターAI

Slide 252

Slide 252 text

空間型AIの作成

Slide 253

Slide 253 text

スマート環境アクター スマートオブジェクト エージェント スマートポイント スマートスペース エージェント エージェント 制御 制御 制御 ドア ドアノブ スペース オブジェクト(物) ポイント(座標)

Slide 254

Slide 254 text

エージェント 主体 客体 エージェント 主体 客体 転換 環境アクター スマート 環境アクター 主客転換制御

Slide 255

Slide 255 text

メタAI エージェント エージェント自律制御 スマート環境アクター制御 スマート環境アクター制御 スマートスペース スマートオブジェクト スマートポイント コミュニケーション コミュニケーション

Slide 256

Slide 256 text

メタAI エージェント エージェント自律制御 スマート環境アクター制御 スマート環境アクター制御 スマートスペース スマートオブジェクト スマートポイント コミュニケーション コミュニケーション コモングラウンド

Slide 257

Slide 257 text

(メッシュ) コスト : 0.5 見通し: 1.0 地表: 床 推奨高度:5m (メッシュ) コスト : 0.5 見通し: 1.0 地表: 床 推奨高度:10m (メッシュ) コスト : 2.5 見通し: 1.0 地表: 土 推奨高度:10m 壁面:ガラス 壁との衝突は 必ず回避してください エージェント ナビゲーション・メッシュ (メッシュ) コスト : 0.5 見通し: 1.0 地表: 床 推奨高度:7m エレベーターの入り口: 使用する場合は、 メッセージ001を送ってください 空間記述表現

Slide 258

Slide 258 text

物理的都市空間 スマートスペース メタバース

Slide 259

Slide 259 text

空間型AIの制御に入る車 メタAI エージェント エージェント自律制御 スマート環境アクター制御 スマート環境アクター制御 スマートスペース スマートオブジェクト スマートポイント コミュニケーション コミュニケーション

Slide 260

Slide 260 text

現実空間のためのキャラクターAI, メタAIの検証

Slide 261

Slide 261 text

オンラインゲーム メタバース 物理空間 世界観 強固、かつ詳細 なるべく緩い設定 現実のまま 物語 大きな物語を準備 物語に沿って イベントが展開 特になし ユーザーが作り出す 現実の経済、人間関係 (ソーシャル)、社会、 など無限の要素 キャラクター (人)の役割 世界、物語の中で 最初から定義 特になし ユーザー の関係の中で発生 不明(実存) オンラインゲーム 物理空間 純粋なメタバース (空っぽの空間)

Slide 262

Slide 262 text

現実世界 デジタル ツイン ミラーワールド スマートシティ メタAI 都市 メタバース (世界モデルと して機能する) 同期 現実を認識する 現実を予測する

Slide 263

Slide 263 text

垂直構造(現実との関連性) 水平構造(世界のスケールの広がり) メタバース 現実世界 デジタル世界 スマート シティ ミラーリングによる同期

Slide 264

Slide 264 text

現実世界 (1) お金の動き (2) 物の動き (3) 人・動物の動き (4) 自然の動き デジタル ツイン (現実世界 そっくりの メタバース) 同期 引き写し ミラーワールド スマートシティ センシングと情報取り込 みによる(1)-(4)の同期 ロボット・AI・情報提示に よるサービス・干渉

Slide 265

Slide 265 text

広場 森 都市 大学 道路 同期 同期 同期 同期 同期 現実と同期するメタバース

Slide 266

Slide 266 text

奈良の鹿ミラーワールド 同期 (ミラー) 現実 メタバース 本物の鹿 デジタルツイン鹿 現実とメタバースをつなぐ

Slide 267

Slide 267 text

物理空間 シミュレーション空間 物理=シミュレーション 混合空間

Slide 268

Slide 268 text

現実世界 現実世界 センサー エフェクタ デジタル ツイン 意思決定・ シミュレーション ゲームエンジン 都市のエージェントの エージェント・ アーキテクチャ 情報経路

Slide 269

Slide 269 text

現実世界 現実世界 センサー エフェクタ デジタル ツイン × 世界モデル (ディープ ラーニング) 都市の 世界モデルの獲得 世界モデル シミュレーション 意思決定 都市の夢を見る シミュレーション エンジン 都市メタAIの エージェント・ アーキテクチャ 情報経路

Slide 270

Slide 270 text

物理世界へ の作用 (指令・行為) 知能 物理世界 情報収集 (知覚) メタバース (集合知性)

Slide 271

Slide 271 text

メタバース 情報の 蓄積 シミュレー ション による予測 人間の叡知 一つの集合知性として機能する 物理空間 への作用 センサー 意思決定 エフェクター 物理空間 からの情報 物理空間へ の作用 集合知性の エージェント・アーキテクチャ

Slide 272

Slide 272 text

物理世界 物理世界 デジタル世界 物理世界 集合知性 メタバース 物理世界 機械 Level I Level 0 Level III Level II 意識の変容 人とデジタル空間の融合 物理世界

Slide 273

Slide 273 text

活動神経網 知覚神経網 作用 (行為) 内的世界 知能 物理世界 物理世界のリアリティ 反作用 (知覚)

Slide 274

Slide 274 text

活動神経網 知覚神経網 反作用 (知覚) 作用 (行為) 内的世界 知能 シミュレーション世界 シミュレーション世界のリアリティ

Slide 275

Slide 275 text

物理世界へ の作用 (指令・行為) 知能 物理世界 情報収集 (知覚) メタバース (集合知性)

Slide 276

Slide 276 text

シミュレーション

Slide 277

Slide 277 text

ゲームエンジンのUnityにPLATEAUのモデルを入れた画面。 モデルは、品川駅周辺のモデル ~都市全体の外観~ ~道路~ PLATEAUは建物のモデル のみなので、市民が実際に 歩くことになる道路は自作。 Pythonでの数値シミュレー ション同様、この道路1つ1 つにサービスの水準を設定 し、市民が通ると効用が得 られるような画面を作る。 今後の展望:実際の都市の3Dモデルによるシミュレーション 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱-」 第64回土木計画学研究発表大会、2021年12月

Slide 278

Slide 278 text

仮想空間シミュレーションの動画 シミュレーションを行っている状況を動画で紹介する。 動画内で赤く動いているのが市民である。 市民は品川駅を目指して動き、その過程で効用が計算されるように実装している。 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱-」 第64回土木計画学研究発表大会、2021年12月

Slide 279

Slide 279 text

メタAI型スマートシティの有効性の検証 (Pythonによる数値シミュレーション) メタAIの有効性を検証するために、まずはPythonによる数値シミュレーションを行う。 実験で想定すること 市民は、目的地に着くまでに何本かの道路を歩く。市民は、バリアフリーが充実している道路等、その道 路のもともとの公共サービスの充実度(サービスの水準)に応じて、効用を得る。さらに、各道路には一体 ずつAIエージェントが配置され、AIエージェントは市民から一人を選んで公共サービスを行う。選ばれた市 民は、その道路から得られる効用が、さらに増加する。メタAIは、AIエージェントが重複して同じ市民を選 ばないように命令し、公共サービスを広く全体に行き渡らせる。 道路1 道路2 メタAI 左の市民は前の道路で選ばれ たので、候補から外しなさい 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱-」 第64回土木計画学研究発表大会、2021年12月

Slide 280

Slide 280 text

メタAIのスマートシティへの活用 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱 -PLATEAUデータを用いたマルチエージェントシミュレーションの観点から-」 第64回土木計画学研究発表大会、2021年12月

Slide 281

Slide 281 text

メタAI型スマートシティの有効性の検証 横軸はシミュレーションの回数、縦軸は社会全体の効用について、 メタAIがある場合の効用から、ない場合の効用を引いたもの 全ての状況において、 メタAIを導入した方が社 会全体の効用が高くな る メタAIがある場合とない場合の差 各パターン 効用の差 ~留意点~ 検証の目的はメタAIが 上手く機能することの確 認であるため、効用の 差の大きさにはあまり 意味はない 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱-」 第64回土木計画学研究発表大会、2021年12月

Slide 282

Slide 282 text

メタバース

Slide 283

Slide 283 text

メタバースの定義

Slide 284

Slide 284 text

メタバース オンライン ゲーム 現実

Slide 285

Slide 285 text

オンラインゲーム メタバース 物理空間 世界観 強固、かつ詳細 なるべく緩い設定 現実のまま 物語 大きな物語を準備 物語に沿って イベントが展開 特になし ユーザーが作り出す 現実の経済、人間関係 (ソーシャル)、社会、 など無限の要素 キャラクター (人)の役割 世界、物語の中で 最初から定義 特になし ユーザー の関係の中で発生 不明(実存) オンラインゲーム 物理空間 純粋なメタバース (空っぽの空間) オンラインゲームとメタバースの違い

Slide 286

Slide 286 text

検索エンジン SNS メタバース 検索サーバー ユーザー ユーザー タイム ライン デジタル空間 インタラク ション デファクト・メジャーの遷移

Slide 287

Slide 287 text

メタバース SNS 検索エンジン 現実の人間関係 現実の情報 現実の情報 現実の人間関係 現実の世界の状態 現実の情報 現実の深度 仮想空間のリアリティ

Slide 288

Slide 288 text

デジタル世界 現実世界 垂直構造(現実との関連性) 水平構造(世界のスケールの広がり) オンライン ゲーム メタバース デジタル空間の水平構造と垂直構造

Slide 289

Slide 289 text

時代 メタバース世界の多様化 2006 セカンドライフ 2008 meet-me 2018 2006 Roblox 2009 Internet Adventure 2012 The Sandbox 2008 PlayStation Home 2011 2021 Horizon Worlds 2008 ai sp@ce メタバース 創成記 メタバースと ゲーム空間の 融合 セカンド ライフの影響 メタバースと 現実空間・ 経済との融合 2017 フォートナイト 2022 仮想通貨SAND導入(2017年-) 2003 EVE ONLINE 2015 2000 Phantasy Star Online / Phantasy Star Online 2 UGCを軸とした オンラインゲーム アイテム課金モデル 仮想通貨の隆盛

Slide 290

Slide 290 text

メタバースとソーシャル

Slide 291

Slide 291 text

ソー シャル 空間 ゲーム 空間 ソーシャル 空間 メタバース ソーシャル 空間 1990 2010 2000 2020 オンラインゲームにおいて 徐々にソーシャル的要素が 入れられていった。SNSに 対抗する必要があった。 1990年代において ゲームはソロプレイか その場の数人でする ものであった。 ゲーム的要素の少ないソーシャル 空間をメインとするメタバースが 台頭する。しかし、ゲームとは つながっている。 ゲーム的要素がまったくない、 独立したソーシャル空間が成立 する。SNSの延長としての ソーシャル空間。 SN S SNS SNS ソーシャル 空間 SNSの台頭と拡大 ゲーム 空間 ゲーム 空間 SNS+ゲーム空間=メタバース

Slide 292

Slide 292 text

ゲーム空間とソーシャル空間 の関係 関係図 特徴 ゲーム空間をメインとしつつ、 その周辺のソーシャル空間を 配置する ゲーム空間を補完する形、或いは ゲーム空間で満たされない部分を ソーシャル空間においてみたすよ うに設計する。たとえば、ゲーム 空間が戦闘であれば、ソーシャル 空間は音楽・演劇など。 ソーシャル空間をメインとし つつ、その中にゲーム空間が 埋め込まれる。 ソーシャル空間がメインであり、 そこにそれぞれ独立したゲーム空 間が埋め込まれる。多くの場合、 ユーザーが作成したミニゲームが 点在する形となる。 ゲーム空間-ソーシャル空間 一体型 ゲーム空間とソーシャル空間の区 別ではない。あらゆる場所がゲー ム空間であり、ユーザーが望めば、 あらゆる空間で交流が可能である。 ゲーム空間 ソーシャル 空間 ゲーム 空間 ゲーム 空間 ゲーム 空間 ゲーム 空間 ソーシャ ル 空間 Roblox Sandbox フォートナイト あつ森など ソーシャル 空間

Slide 293

Slide 293 text

メタバース=ゲーム空間の解放 オンラインゲーム

Slide 294

Slide 294 text

人 人 テキスト テキスト 人 人 画像/声 画像/声 人 人 擬似身体・声 擬似身体・声 空間 メタバース オンライン会議 SNS・チャットなど 拡張するコミュニケーション

Slide 295

Slide 295 text

人 エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント 人 エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント 人 エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント 人-エージェント-エージェント-人関係 人-人関係 から 人-AI-AI-人 関係へ

Slide 296

Slide 296 text

文化 社会 文化は社会を変える AI文化はAIを変える 集積された文化を編纂し促進するAI =科学者・芸術家 AI文化はAIが集積する エー ジェン ト エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント エー ジェ ント

Slide 297

Slide 297 text

ゲーム世界 プレイヤー (主人公) プレイする バーチャル アイドル プロデューサー 応援する・ プロデュース する ゲーム世界 (eSports) 観戦者 観戦する メタバース 一参加者 参加する デジタル世界への参加の仕方の変化 デジタル空間への参加の仕方の変化

Slide 298

Slide 298 text

メタバース (コモングラウンド)

Slide 299

Slide 299 text

スマートシティとメタバースの融合、 人間の行動変容

Slide 300

Slide 300 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能

Slide 301

Slide 301 text

現実世界 デジタル ツイン (現実世界 そっくりの メタバース) 相互作用 ミラーワールド スマートシティ センシング AIによる干渉

Slide 302

Slide 302 text

現実世界 デジタル ツイン ミラーワールド スマートシティ メタAI 都市 メタバース (世界モデルとし て機能する) 同期 引き写し 現実を認識する 現実を予測する

Slide 303

Slide 303 text

活動神経網 知覚神経網 作用 (行為) 内的世界 知能 物理世界 物理世界のリアリティ 反作用 (知覚)

Slide 304

Slide 304 text

活動神経網 知覚神経網 反作用 (知覚) 作用 (行為) 内的世界 知能 シミュレーション世界 シミュレーション世界のリアリティ

Slide 305

Slide 305 text

人の知的レベル=環境との相互作用による知的行動 人 環境(世界) 知的行動 知的行動の拡大

Slide 306

Slide 306 text

環境(世界) 知的行動 知的行動の拡大 人 他者(自律的存在) 信頼感情の生成 人の知性の拡大

Slide 307

Slide 307 text

スマートシティ エージェント 知的行動 知的行動の拡大 人 メタAI スマートシティによる知的行動の拡大

Slide 308

Slide 308 text

新しい現実 スマートシティ エージェント 知的行動 知的行動の拡大 メタバース 人 メタAI 人の知性の拡大

Slide 309

Slide 309 text

デジタルゲームから現実=仮想融合世界へ これまでの研究: デジタルゲームの人工知能の 汎用的フレームの構築 これからの研究:都市のための人工知能の 汎用的フレームの構築

Slide 310

Slide 310 text

これまでの研究: デジタルゲームの人工知能の 汎用的フレームの構築 これからの研究:都市のための人工知能の 汎用的フレームの構築 人工知能が人間 を理解すること 人工知能が社会 を理解すること デジタルゲームから現実=仮想融合世界へ

Slide 311

Slide 311 text

ブロックチェーンとローカリティ • AIは普遍的なもの→AIは大局的なもの =大きなAI(chatGPTなど)が世界にいくつかできる未来 https://illust-ryokka.jp/material/map/global-map/ AI AI AI AI AI AI AI

Slide 312

Slide 312 text

ノード 知識

Slide 313

Slide 313 text

ブロックチェーン上のAI ブロックチェーン上のAI ブロックチェーン上のAI