Slide 1

Slide 1 text

「話す、たたかう、作りだす ゲームとAIの50年史」 三宅 陽一郎 @miyayou 2023.6.17 @ゲンロンカフェ 新時代の教養講座「ゲンロン・セミナー」 第1期「1000分で『遊び』学」 https://www.facebook.com/youichiro.miyake [email protected] https://miyayou.com/ https://www.genron-alpha.com/genron-seminar-1st/

Slide 2

Slide 2 text

自己紹介

Slide 3

Slide 3 text

My Works (2004-2022) AI for Game Titles Books

Slide 4

Slide 4 text

近著

Slide 5

Slide 5 text

No content

Slide 6

Slide 6 text

No content

Slide 7

Slide 7 text

戦略ゲームAI • 戦略ゲームにおける人工知能の技術を、 起源から集めた著作 • 2021年10月15日 • 300ページぐらい

Slide 8

Slide 8 text

シミュレーション 現実 機械学習 (ディープ ラーニン グ) DeepMind社「Capture the flag」による ディープラーニング学習 https://deepmind.com/blog/article/capture-the-flag-science

Slide 9

Slide 9 text

ゲームと人工知能の関係 ゲームAI ゲームを外側から プレイするAI ゲーム内側から 構成するAI 将棋、チェス、囲碁… アカデミックで研究されるAI アカデミックではゲームを製作する、 ということはなかなかできない・しない マリオ、ゼルダ、フォートナイト 産業で開発されるAI ゲームを構成するAI ゲームを作り出す 人工知能 ゲームを管理する人工知能 ゲームを製作する人工知能

Slide 10

Slide 10 text

第一部 ゲームを外側からプレイするAI

Slide 11

Slide 11 text

ゲームと人工知能の関係 ゲームAI ゲームを外側から プレイするAI ゲーム内側から 構成するAI 将棋、チェス、囲碁… アカデミックで研究されるAI アカデミックではゲームを製作する、 ということはなかなかできない・しない マリオ、ゼルダ、フォートナイト 産業で開発されるAI ゲームを構成するAI ゲームを作り出す 人工知能 ゲームを管理する人工知能 ゲームを製作する人工知能 人工知能は自らを発展させるためにゲームを利用した

Slide 12

Slide 12 text

人工知能の歴史とゲーム • 人工知能の誕生 1940-1950年代 • ダートマス会議(1956年) • コンピュータの歴史と人工知能の歴史 • 1950年代にはコンピュータ=巨大頭脳

Slide 13

Slide 13 text

人工知能に何をさせるか? • 人工知能の誕生期 • 「閉じた問題」しか解けない • 人工知能を鍛える問題が必要 箱庭(ゲーム)を解かせる 迷路、チェッカー、将棋、囲碁 迷路学習する機械式マウスを操作する シャノン(情報学の父) (photo: Bell Labs)

Slide 14

Slide 14 text

ダートマス会議(1956年) 我々は、1956年の夏の2ヶ月間、10人の人工知能研究者がニューハンプ シャー州ハノーバーのダートマス大学に集まることを提案する。そこで、 学習のあらゆる観点や知能の他の機能を正確に説明することで機械が それらをシミュレートできるようにするための基本的研究を進める。機械 が言語を使うことができるようにする方法の探究、機械上での抽象化と 概念の形成、今は人間にしか解けない問題を機械で解くこと、機械が自 分自身を改善する方法などの探究の試みがなされるだろう。我々は、注 意深く選ばれた科学者のグループがひと夏集まれば、それらの問題のう ちいくつかで大きな進展が得られると考えている。 https://ja.wikipedia.org/wiki/%E3%83%80%E3%83%BC%E3%83%88%E3%83%9E%E3%82%B9%E4%BC%9A%E8%AD%B0 人工知能=人間の知能を機械に写す(移す)。

Slide 15

Slide 15 text

http://static.flickr.com/5051/5525304279_65012a492c_s.jpg ? http://flopdesign.com/download/Human_S/pages/B50.ht ml ?

Slide 16

Slide 16 text

人間の知能の形/人工知能の知能の形 人間(生物)の知能=総合的知能 一つの知能がいろんなことをできる お料理できる 将棋が打てる 目的地へ行ける 何でもできる可能性を 持つ総合知性

Slide 17

Slide 17 text

人間の知能の形/人工知能の知能の形 AlphaGO =囲碁しか打てない =人間より強い ナビ =目的地へのルート = とても正確 お掃除ロボット =お掃除しかできない = 24時間掃除 IBM ワトソン =記号の統計情報しかない =何百万行のテキストの関係 を記憶 お料理ロボット =お料理しかできない =何万と言うレシピ 人工知能=専門的知能 一つのことしかできない。

Slide 18

Slide 18 text

人間の知能の形/人工知能の知能の形 お料理ロボット =お料理しかできない AlphaGO =囲碁しか打てない ナビ =目的地へのルート お掃除ロボット =お掃除しかできない 人工知能=専門的知能 一つのことしかできない。一つのことがとても(人間より)得意。 IBM ワトソン =記号の統計情報しかない =何百万行のテキストの関係 を記憶

Slide 19

Slide 19 text

時間(イメージ) 空間(論理) 殆どの人工知能は与えられたフレーム(問題設定)の 外に出ることはできない。 人間は柔軟にフレーム(問題設定)を創造し 変化させることができる。 人間と人工知能の違い

Slide 20

Slide 20 text

人工知能は自分で問題(フレーム)を 作れない。 与えられた問題の中で、人間より賢くなる。 これからの時代に必要な能力 =問題を作る能力 =人工知能を使役する能力

Slide 21

Slide 21 text

閉じている 開いている 総合型 専門型 直観 精密 総合型人工知能 (汎用人工知能) 問題特化型 人工知能

Slide 22

Slide 22 text

閉じている 開いている 総合型 専門型 直観 精密 総合型人工知能 (汎用人工知能) 問題特化型 人工知能 フレームが 閉じている 問題領域

Slide 23

Slide 23 text

閉じている 開いている 総合型 専門型 直観 精密 総合型人工知能 (汎用人工知能) 問題特化型 人工知能 フレームが 閉じている 問題領域 フレームが 閉じていない 問題領域

Slide 24

Slide 24 text

閉じている 開いている 総合型 専門型 直観 精密 総合型人工知能 (汎用人工知能) 問題特化型 人工知能 モラベックのパラドックス =人間と人工知能に得意・ 不得意は正反対

Slide 25

Slide 25 text

閉じている 開いている 総合型 専門型 直観 精密 総合型人工知能 (汎用人工知能) 問題特化型 人工知能 フレームが 閉じている 問題領域 フレームが 閉じていない 問題領域

Slide 26

Slide 26 text

閉じている 開いている 総合型 専門型 直観 精密 総合型人工知能 (汎用人工知能) 問題特化型 人工知能 フレームが 閉じていない 問題領域 フレームが 閉じている 問題領域

Slide 27

Slide 27 text

閉じている 開いている 総合型 専門型 直観 精密 総合型人工知能 (汎用人工知能) 問題特化型 人工知能 フレームが 閉じていない 問題領域 ゲーム

Slide 28

Slide 28 text

閉じている 開いている 総合型 専門型 直観 精密 総合型人工知能 (汎用人工知能) 問題特化型 人工知能 フレームが 閉じている 問題領域 フレームが 閉じていない 問題領域 ゲーム

Slide 29

Slide 29 text

身体 身体 環境 意識 前意識 無意識 (言語の網) 意識 前意識 無意識 (プログラム 言語の網) 外部から の情報 言語・非言語境界面 知覚の境界面 人間 人工知能(エージェント) 意識的干渉 無意識的干渉 外部からの 情報 物理的干渉 他者の構成 他者の構成プロセス

Slide 30

Slide 30 text

身体 身体 環境 意識 前意識 無意識 (言語の網) 意識 前意識 無意識 (プログラム 言語の網) 外部から の情報 人間 人工知能(エージェント) 外部からの 情報 物理的干渉 他者の構成プロセス 人間と人工知能は複数のレイヤーで結ばれる

Slide 31

Slide 31 text

身体 身体 環境 意識 前意識 無意識 (言語の網) 意識 前意識 無意識 (プログラム 言語の網) 外部から の情報 人間 人工知能(エージェント) 外部からの 情報 物理的干渉 他者の構成プロセス ゆったりとした強い同期の輪 人間と人工知能は複数の関係で 結ばれている

Slide 32

Slide 32 text

身体 身体 環境 意識 前意識 無意識 (言語の網) 意識 前意識 無意識 (プログラム 言語の網) 外部から の情報 人間 人工知能(エージェント) 外部からの 情報 物理的干渉 他者の構成プロセス ゆったりとした強い同期の輪 人間と人工知能は複数の関係で 結ばれている =人間同士も、人間と人工知能同士も なかなかわかりあえない

Slide 33

Slide 33 text

身体 身体 環境 意識 前意識 無意識 (言語の網) 意識 前意識 無意識 (プログラム 言語の網) 外部から の情報 人間 人工知能(エージェント) 外部からの 情報 物理的干渉 他者の構成プロセス ゆったりとした強い同期の輪 わかりあえない、のは、 環境が複雑だからでもある。 世界内存在でも、セカイがみんな違う

Slide 34

Slide 34 text

身体 身体 ゲーム 意識 前意識 無意識 (言語の網) 意識 前意識 無意識 (プログラム 言語の網) 外部から の情報 人間 人工知能(エージェント) 外部からの 情報 物理的干渉 他者の構成プロセス ゆったりとした強い同期の輪

Slide 35

Slide 35 text

身体 身体 ゲーム 意識 前意識 無意識 (言語の網) 意識 前意識 無意識 (プログラム 言語の網) 外部から の情報 人間 人工知能(エージェント) 外部からの 情報 物理的干渉 他者の構成プロセス ゆったりとした強い同期の輪 一般にはわかりあえない、しかし、 人間同士も、人間と人工知能も ゲームという場を通してわかり合える。

Slide 36

Slide 36 text

ボードゲームの人工知能 • 人工知能の誕生以来、それは人工知能を育む箱庭(揺り籠) だった。 • それでも人間の方がずっと強かった • ボードゲームは盤面の情報を表現しやすい(知識表現) • ボードゲームは完全に情報を表現しやすい(完全情報)

Slide 37

Slide 37 text

城壁を作って行くゲーム『カルカソンヌ』 作った城壁の大きさで勝敗が決まるゲーム。

Slide 38

Slide 38 text

ロンドンの街を舞台にした逃走と追走劇 『スコットランドヤード』 街の構造が思わぬ逃走を可能にする。ロンドンという街を体験した気に少しなる。

Slide 39

Slide 39 text

中世ベネチアを舞台にしたスパイ同士の 探り合い『インコグニト』 http://www.ps-hiroshima.com/board/inkognito.htm 誰が味方か、誰が敵かを、街を舞台に探り合う

Slide 40

Slide 40 text

ディープブルー(チェス、1997) 1997年 ディープブルーがカスパロフに勝利 機械学習を用いない探索で勝利 開発はIBMと中身はアルバータ大学 https://wired.jp/2012/10/03/deep-blue-computer-bug/

Slide 41

Slide 41 text

一手先(自分) 分岐 三手先(自分) 二手先(相手) ゲーム状態(=盤面) 人工知能による探索 探索アルゴリズム

Slide 42

Slide 42 text

AlphaGo(囲碁、2016) 2016年 AlphaGoがィ・セドル棋士に勝利 ディープラーニング、モンテカルロ木探索を用いて勝利 開発はDeep Mind社 https://norakuranews.com/alphago-leesedol3/

Slide 43

Slide 43 text

ゲーム(フレーム) ゲームに全人格を取り込むことはできない =しかし部分的な自分と人工知能がゲームでわかりあう 自分 ゲーム 人工知能 ゲームの中の プレイヤー 対戦

Slide 44

Slide 44 text

DQNを有名にした 「AlphaGO」

Slide 45

Slide 45 text

AlphaGo は3つの要素からなる • DQN(Deep Q Neural Network)2013年 • モンテカルロ木探索 2004年 • 強化学習 1990年代後半

Slide 46

Slide 46 text

DQN (Deep Q network)とは

Slide 47

Slide 47 text

Deep Q Learning (深層強化学習) Q-Learning × Deep Learning

Slide 48

Slide 48 text

世界 五感 身体 言語 知識表 現型 知識 生成 Knowledge Making 意思決定 Decision Making 身体 運動 生成 Motion Making インフォメーション・フロー(情報回廊) 記憶 キャラクターにおける学習の原理 行動の表現 結果の表現 意思決定 Q(s,a) 関数

Slide 49

Slide 49 text

Deep Q Network (DQN)とは • Q = 予想される報酬 (意思決定関数) • S = State (座標、速度、現在の姿勢) • A = Action (キック、パンチ、波動拳) • R = 報酬 • Q (s,a ) という関数を決める方法 深層ニューラルネットワーク Deep Q Network

Slide 50

Slide 50 text

世界 五感 身体 言語 知識表 現型 知識 生成 Knowledge Making 意思決定 Decision Making 身体 運動 生成 Motion Making インフォメーション・フロー(情報回廊) 記憶 キャラクターにおける学習の原理 行動の表現 状態・結果の表現 意思決定 ニューラル ネットワーク (DQN)

Slide 51

Slide 51 text

Deep Q-Learning (2013) Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller (DeepMind Technologies) Playing Atari with Deep Reinforcement Learning http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf 画面を入力 操作はあらかじめ教える スコアによる強化学習 DQN Breakout (Google Deep Mind) https://www.youtube.com/watch?v=TmPfTpjtdgg

Slide 52

Slide 52 text

学習過程解析 Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller (DeepMind Technologies) Playing Atari with Deep Reinforcement Learning http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

Slide 53

Slide 53 text

AlphaGO 膨大な棋譜のデータ (人間では多過ぎて 読めない) この棋譜を そっくり打てる ように学習する 自己対戦して 棋譜を貯める この棋譜を そっくり打てる ように学習する AlphaGO

Slide 54

Slide 54 text

• Pπ ロールアウトポリシー(ロールアウトで討つ手を決める。 Pπ(a|s) sという状態でaを討つ確率) • Pσ Supervised Learning Network プロの討つ手からその 手を討つ確率を決める。Pσ(a|s)sという状態でaを討つ確 率。 • Pρ 強化学習ネットワーク。Pρ(学習済み)に初期化。 • Vθ(s’) 局面の状態 S’ を見たときに、勝敗の確率を予測 する関数。つまり、勝つか、負けるかを返します。 Mastering the game of Go with deep neural networks and tree search http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html https://deepmind.com/research/alphago/

Slide 55

Slide 55 text

囲碁AI: 位置評価関数から位置評価ニューラルネットワークへ Mastering the game of Go with deep neural networks and tree search http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html https://deepmind.com/research/alphago/ S Q

Slide 56

Slide 56 text

AlphaGo は3つの要素からなる • DQN(Deep Q Neural Network)2013年 • モンテカルロ木探索 2006年 • 強化学習 1990年代後半

Slide 57

Slide 57 text

モンテカルロ木探索とは (MCTS)

Slide 58

Slide 58 text

現在の盤面の状態 負 勝率 : 4/5 勝率 : 2/5 勝率 : 3/5 基本、 乱数による プレイアウト 勝 候補となる手

Slide 59

Slide 59 text

より有望そうな枝を試すアルゴリズム W_1(=80) W_2(=70) W_3(=120) 試行回数 報酬合計 3回 2回 4回 全試行回数 9回 20ドル/回 マシン1 マシン2 マシン3 120 80 + 2 ∗ 9 80 70 40 + 2 ∗ 9 40 80 60 + 2 ∗ 9 60 UCB1 掛け金総額 60ドル 40ドル 80ドル プレイヤー

Slide 60

Slide 60 text

モンテカルロ木探索の衝撃(2006年) • モンテカルロ木探索は囲碁AIを革新した • 過去10年分の発展を一気になしとげた

Slide 61

Slide 61 text

現在のゲーム状態 次の一手のゲーム状態 次の次の一手のゲーム状態 末端 次の一手の中で一番 リグレットの値が一番高いノード 一回シミュレーションを加えたら、それまでのノードに結果を反映してリグレット値を更新 次の次の一手の中で一番 リグレットの値が一番高い ノード 次の次の次の一手の中で一番 リグレットの値が一番高いノード Value

Slide 62

Slide 62 text

アクション・バケット 末端のノード 選択された アクション・バケット 現在のゲーム状態 Combat := if prev( wait ) then Artillery AttackOrder SpecialOrder UseGate Openings := if root then WaitUntilContact WaitUntilAmbush PuckStealth

Slide 63

Slide 63 text

敵チーム AIチーム AIチーム ゲート

Slide 64

Slide 64 text

Fable Legends Fable Legends Gameplay Demo - IGN Live: E3 2014 https://www.youtube.com/watch?v=hQM_Dw_b0jE

Slide 65

Slide 65 text

AlphaGo は3つの要素からなる • DQN(Deep Q Neural Network)2013年 • モンテカルロ木探索 2004年 • 強化学習 1990年代後半

Slide 66

Slide 66 text

Hopper Training Hopper Trained

Slide 67

Slide 67 text

Early in the learning process … … after 15 minutes of learning Reward for decrease in Wulong Goth’s health Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx

Slide 68

Slide 68 text

Early in the learning process … … after 15 minutes of learning Punishment for decrease in either player’s health Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx

Slide 69

Slide 69 text

Forza motorsports (EA) Jeffrey Schlimmer, "Drivatar and Machine Learning Racing Skills in the Forza Series" http://archives.nucl.ai/recording/drivatar-and-machine-learning-racing-skills-in-the-forza-series/

Slide 70

Slide 70 text

Drivatar (Microsoft, Forza Motorsport) How Forza's Drivatar Actually Works | AI and Games #60 https://www.youtube.com/watch?v=JeYP9eyIl4E

Slide 71

Slide 71 text

AlphaGo(囲碁) 2014年 AlphaGoがィ・セドル棋士に勝利 ディープラーニング、モンテカルロ木探索を用いて勝利 開発はDeep Mind社

Slide 72

Slide 72 text

Deep Mind社 「Agent 57」 • Atariの古典的なゲーム57個を人間よりうまくプレイできるよう になった Deep Mind社のAI • https://deepmind.com/blog/article/Agent57-Outperforming- the-human-Atari-benchmark

Slide 73

Slide 73 text

DQNのさらなる発展 • 最後までスコアに苦しんだゲーム • Montezuma’s Revenge • Pitfall • Solaris • Skiing Agent57: Outperforming the human Atari benchmark (DeepMind) https://deepmind.com/blog/article/Agent57-Outperforming-the-human-Atari-benchmark

Slide 74

Slide 74 text

Montezuma’s Revenge BootDQN + Randomized Prior playing Montezuma's Revenge https://www.youtube.com/watch?v=pqkM1PrIOyI

Slide 75

Slide 75 text

Solaris Agent57 playing Solaris (Google DeepMind) https://www.youtube.com/watch?v=QDb3rmEBTZI

Slide 76

Slide 76 text

Pitfall! NGU playing Pitfall! (Google DeepMind) https://www.youtube.com/watch?v=imAeLt1BPu4

Slide 77

Slide 77 text

Skiing NGU playing Skiing (Google DeepMind) https://www.youtube.com/watch?v=0_67wNXyOcI

Slide 78

Slide 78 text

ディープラーニングの デジタルゲームへの躍進

Slide 79

Slide 79 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 80

Slide 80 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 81

Slide 81 text

DeepMind社「Capture the flag」 によるディープラーニング学習 (2019年)

Slide 82

Slide 82 text

シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://deepmind.com/blog/article/capture-the-flag-science Human-level performance in 3D multiplayer games with population-based reinforcement learning Max Jaderberg et al. Science 31 May 2019: Vol. 364, Issue 6443, pp. 859-865 DOI: 10.1126/science.aau6249

Slide 83

Slide 83 text

OpenAI「HIDE AND SEEK」 による学習 (2019年)

Slide 84

Slide 84 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 85

Slide 85 text

「かくれんぼ」によってマルチエージェ ントを学習させる • オブジェクトがあって、動かしたり固 定したりできる。 • オブジェクトは直方体、傾斜台、長い 板がある。 • 一度固定したオブジェトは動かせない • エージェントは次第にオブジェクトを 利用してかくれんぼをするようになる • 6種類の戦術を順番に発見・学習して いく https://openai.com/blog/emergent-tool-use/ Emergent Tool Use From Multi-Agent Autocurricula (2019) Bowen Baker, Ingmar Kanitscheider, Todor Markov, Yi Wu, Glenn Powell, Bob McGrew, Igor Mordatch https://arxiv.org/abs/1909.07528

Slide 86

Slide 86 text

Multi-Agent Hide and Seek (OpenAI) https://www.youtube.com/watch?v=kopoLzvh5jY

Slide 87

Slide 87 text

ビックデータ x ディープラーニング から シミュレーション x ディープラーニング へ

Slide 88

Slide 88 text

技術の変わり目 ビックデータ x ディープラーニング シミュレーション x ディープラーニング データが貯まるところでディープラーニングを行い特徴抽出を行う シミュレーションでデータを貯めてディープラーニングを行う

Slide 89

Slide 89 text

シミュレーション 現実 機械学習 (ディープ ラーニン グ) DeepMind社「Capture the flag」による ディープラーニング学習 https://deepmind.com/blog/article/capture-the-flag-science

Slide 90

Slide 90 text

Google 「サッカーシミュレーター」による強化学習の 研究 https://automaton-media.com/articles/newsjp/20190613-95002/ シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://ai.googleblog.com/2019/06/introducing-google-research-football.html https://www.youtube.com/watch?v=F8DcgFDT9sc&t=4s

Slide 91

Slide 91 text

Microsoft 「AirSim」による強化学習の研究 シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://microsoft.github.io/AirSim/ https://www.youtube.com/watch?v=-WfTr1-OBGQ&t=9s

Slide 92

Slide 92 text

Nvidia「ドライビングシミュレーター」による強化学習 の研究 シミュレーション 現実 機械学習 (ディープ ラーニン グ) https://www.nvidia.com/en-us/self-driving-cars/drive-constellation Neural Reconstruction Engine in NVIDIA DRIVE Sim (NVIDIA) https://www.youtube.com/watch?v=vgot-CK1xRk&t=5s

Slide 93

Slide 93 text

第ニ部 ゲーム内側から構成するAI

Slide 94

Slide 94 text

ゲームと人工知能の関係 ゲームAI ゲームを外側から プレイするAI ゲーム内側から 構成するAI 将棋、チェス、囲碁… アカデミックで研究されるAI アカデミックではゲームを製作する、 ということはなかなかできない・しない マリオ、ゼルダ、フォートナイト 産業で開発されるAI ゲームを構成するAI ゲームを作り出す 人工知能 ゲームを管理する人工知能 ゲームを製作する人工知能

Slide 95

Slide 95 text

ゲームと人工知能の関係 ゲームAI ゲームを外側から プレイするAI ゲーム内側から 構成するAI 将棋、チェス、囲碁… アカデミックで研究されるAI アカデミックではゲームを製作する、 ということはなかなかできない・しない マリオ、ゼルダ、フォートナイト 産業で開発されるAI ゲームを構成するAI ゲームを作り出す 人工知能 ゲームを管理する人工知能 ゲームを製作する人工知能

Slide 96

Slide 96 text

ボードゲームの人工知能 ボードゲーム 一般の デジタルゲーム 時間:ターンベース 空間:グリッド 非連続時間、非連続空間 =AIが考えやすい 時間:連続空間 空間:連続時間 連続時間、連続空間 =AIにとってなかなかヘビー

Slide 97

Slide 97 text

ボードゲームの人工知能 ボードゲーム 一般の デジタルゲーム 時間:ターンベース 空間:グリッド 非連続時間、非連続空間 =AIが考えやすい =でも難しい =最善手を長時間考える 時間:連続空間 空間:連続時間 連続時間、連続空間 =AIにとってなかなかヘビー =1/60秒近くで意思決定 =最善手でなくていい

Slide 98

Slide 98 text

ゲームには2つのルーツがある ・アクションゲーム ・物語ゲーム どちらもその誕生に人工知能が深く関係している

Slide 99

Slide 99 text

二つのゲームの潮流に必要なAI 物語的 ゲーム アクション ゲーム 物語を進行するAIと 物語の中で役を演じるAI ゲームの空間でうまく運動するAIと 環境や状況をリアルタイムで認識するAI デジタルゲーム

Slide 100

Slide 100 text

二つのゲームの潮流に必要なAI 物語的 ゲーム アクション ゲーム 物語るAI 演技的AI 人工生命 エージェント デジタルゲーム

Slide 101

Slide 101 text

ゲームには2つのルーツがある ・アクションゲーム ・物語ゲーム どちらもその誕生に人工知能が深く関係している

Slide 102

Slide 102 text

第二章 第一節 アクションゲーム 第二節 物語ゲーム

Slide 103

Slide 103 text

公開された「パックマン」仕様書 岩谷徹, 高橋ミレイ , 三宅陽一郎, “ゲームAI の原点『パックマン』はいかにして生み出されたのか?: 岩谷 徹インタビュー,” 人工知能,Vol.34, No.1 pp.86-99., 2019. Japanese Society of Artificial Intelligence,No.1, 2019. Anyone can download the article: https://jsai.ixsq.nii.ac.jp/ej/index.php?active_action=repository_view_main_item_detail&page_id=13&block_id=23&item_id=9670&item_no=1

Slide 104

Slide 104 text

パックマン パックマン(PAC-MAN) Bandai Namco Entertainment https://www.youtube.com/watch?v=WbqC-sP3eUQ

Slide 105

Slide 105 text

① モンスターの2つの波状攻撃 ② モンスターの個性的な行動と間接的な協調 ④ それぞれのレベルにおけるスピードコントロール ③ 生体タイミングコントロール パックマンのAI技術

Slide 106

Slide 106 text

① モンスターの2つの波状攻撃 ② モンスターの個性的な行動と間接的な協調 ④ それぞれのレベルにおけるスピードコントロール ③ 生体タイミングコントロール パックマンのAI技術

Slide 107

Slide 107 text

AI Monsters’ Behavior Policy: PAC-MAN 波状攻撃 4体のモンスターが同時に攻撃 2つのモード 集合(攻撃)と離散(休み)を一定時間ごとに繰り返す

Slide 108

Slide 108 text

モンスターの2つのモード: 集合と離散 集合モード 離散モード

Slide 109

Slide 109 text

7s 20s 7s 20s 5s 20s 5s 5s 20s 5s 20s 5s 27 34 54 59 7 25 30 50 55 5 79 84 7s 20s 7s 20s 5s 27 34 54 59 7 Monster Rest(四隅で待機) Monster Attack(一斉に攻撃) A B C, D (sec) (sec) (sec) 3つの波状攻撃タイミングテーブル

Slide 110

Slide 110 text

① モンスターの2つの波状攻撃 ② モンスターの個性的な行動と間接的な協調 ④ それぞれのレベルにおけるスピードコントロール ③ 生体タイミングコントロール パックマンのAI技術

Slide 111

Slide 111 text

モンスター 波状攻撃の状態 包囲攻撃 離散 アカ 常にパックマンのいるマス (8x8ドット)を追う プレイフィールド上の右上付近を 動き回る. ピンク パックマンの口先の3つ先の マスを目指す プレイフィールド上の左上付近を 動き回る. シアン 赤モンスターのパックマンを 中心とした点対称を目指す プレイフィールド上の右下付近を 動き回る. オレンジ パックマンから半径約130 ドットの外では赤モンスターの 性格を持ち、半径内ではパック マンと無関係にランダムに動く プレイフィールド上の左下付近を 動き回る. 4匹の攻撃の方法にバリエーションを持たせる

Slide 112

Slide 112 text

パックマンの周囲の位置取り Surrounding around a PAC-MAN

Slide 113

Slide 113 text

① モンスターの2つの波状攻撃 ② モンスターの個性的な行動と間接的な協調 ④ それぞれのレベルにおけるスピードコントロール ③ 生成タイミングコントロール パックマンのAI技術

Slide 114

Slide 114 text

2匹 3匹 4匹 A B C モンスター出現数 244個 30個 90個 3匹 4匹 50個 4匹 (食べたえさの数)

Slide 115

Slide 115 text

① モンスターの2つの波状攻撃 ② モンスターの個性的な行動と間接的な協調 ④ それぞれのレベルにおけるスピードコントロール ③ 生体タイミングコントロール パックマンのAI技術

Slide 116

Slide 116 text

SPEED PATTERN SPEED A B C D 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 ① イジケ ワープ ② ① イジケ ワープ ② ① イジケ ワープ ② ① イジケ ワープ ②

Slide 117

Slide 117 text

デジタルゲームAI入門① (キャラクターAI)

Slide 118

Slide 118 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query 頭脳として機能 MCS-AI動的 連携モデル query

Slide 119

Slide 119 text

レベルスクリプト ナビゲーションAI キャラクターAI メタAI 1995 2000 2005 2010 1999 (スクリプティッドAIによる 大型ゲームのキャラクター制御の限界。 自律型AI技術のアカデミックからの流入) (ゲームの3D化) 1994 2005 (ウィル・ライトによる“メタAI”定義) 2008 (“LEFT 4 DEAD”ににおけるAI Director) 2010頃~ (オープンワールド型ゲームの隆盛) スパーシャルAI 1980 PlayStation (1994) Xbox360 (2005) PlayStation3 (2006) スクリプティッドAI 三宅陽一郎、水野勇太、里井大輝、 「メタAI」と「AI Director」の歴史的発展、日本デジタルゲーム学会(2020年、Vol.13, No.2) https://www.jstage.jst.go.jp/article/digraj/13/2/13_1/_article/-char/ja/ LS-Modelモデル LCN-AI連携モデル MCS-AI動的連携モデル MCN-AI連携モデル

Slide 120

Slide 120 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル

Slide 121

Slide 121 text

知能の世界 環境世界 認識の 形成 記憶 意思の 決定 身体 制御 エフェクター・ 身体 運動の 構成 センサー・ 身体 意思決定 モジュール 意思決定 モジュール 意思決定 モジュール 記憶体 情報処理過程 運動創出過程 身体部分 情報 統合 運動 統合

Slide 122

Slide 122 text

FC SFC SS, PS PS2,GC,Xbox Xbox360, PS3, Wii DC (次世代) Hardware 時間軸 2005 1999 ゲームの進化と人工知能 複雑な世界の 複雑なAI ゲームも世界も、AIの身体と内面もますます複雑になる。 単純な世界の シンプルなAI (スペースインベーダー、タイトー、1978年) (アサシンクリード、ゲームロフト、2007年)

Slide 123

Slide 123 text

(例) スペースインベーダー(1978) プレイヤーの動きに関係なく、決められた動きをする (スペースインベーダー、タイトー、1978年)

Slide 124

Slide 124 text

(例)プリンス・オブ・ペルシャ 「プリンス・オブ・ペルシャ」など、 スプライトアニメーションを用意する必要がある場合、 必然的にこういった制御となる。 (プリンスオブペルシャ、1989年)

Slide 125

Slide 125 text

3Dゲームの中のAI Halo (HALO、バンジー、2001年) デバッグ画面 The Illusion of Intelligence - Bungie.net Downloads http://downloads.bungie.net/presentations/gdc02_jaime_griesemer.ppt

Slide 126

Slide 126 text

Early in the learning process … … after 15 minutes of learning Reward for decrease in Wulong Goth’s health Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge "Forza, Halo, Xbox Live The Magic of Research in Microsoft Products" http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx

Slide 127

Slide 127 text

 Session Name: AI Summit: Multi-Agent Reinforcement Learning Invades MMORPG: 'Lineage Clone Wars'  Speaker(s): Jinhyung Ahn, Inseok Oh  Company Name(s): NCSOFT, NCSOFT  Track / Format: AI Summit  https://www.gdcvault.com/play/ 1027645/AI-Summit-Multi- Agent-Reinforcement

Slide 128

Slide 128 text

強化学習によるキャラクター制御(2023) https://schedule.gdconf.com/session/multi-agent-reinforcement-learning-with-roller-champions/890285

Slide 129

Slide 129 text

デジタルゲームAI入門② (スパーシャルAI)

Slide 130

Slide 130 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル

Slide 131

Slide 131 text

ネットワーク上のグラフ検索法 A*法 M F L B A S O P D C G S V H Q X K N J R T W E I U Z Y G 5 4 6 3 7 2 3 B C 3 3 2 2 4 3 5 5 出発点(S)を中心に、そのノードまでの 最も短い経路を形成して行く。Gにたどり着いたら終了。 ゴール地点がわかっている場合、現在のノードとゴールとの推定距離(ヒューリスティック距離) を想定して、トータル距離を取り、それが最少のノードを探索して行く。 各ノードの評価距離=出発点からの経路+ヒューリスティック距離 ヒューリスティック距離 (普通ユークリッド距離を取る) 3+14.2 3+13.8 G H 3 5+10.5 6+8.4

Slide 132

Slide 132 text

パス検索(デモと実例) RTS - Pathfinding A* https://www.youtube.com/watch?v=95aHGzzNCY8 Dragon Age pathfinding program put to the test (UniversityofAlberta) https://www.youtube.com/watch?v=l7YQ5_Nbifo

Slide 133

Slide 133 text

(メッシュ) コスト : 0.5 見通し: 1.0 地表: 土 (メッシュ) コスト : 0.8 見通し: 0.7 地表: 沼 (オブジェクト) 動かせる : (1.0,0.8)向き 持ち上げる: false 上に乗れる: false 硬さ: 0.9 重たさ: 0.4 (オブジェクト) アクション:レバー倒す 効果: 扉が開く (オブジェクト)扉 メッシュ同士の リンク情報

Slide 134

Slide 134 text

スパーシャルAI 空間解析 状況解析 位置検索技術 パス検索 スマートオブジェクト など多数 影響マップ など多数

Slide 135

Slide 135 text

プレイヤー予測経路(ゴールデンパス) M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 136

Slide 136 text

ゴールデンパスに沿った位置検索技術 プレイヤーの 予想目標地点 プレイヤーの現在位置 ゴールデンパス ゴールデンパス上で、20m以上プレイヤーから離れて、 40m以内にある場所で、ゴールデンパスから幅10mの領域でポイントを見つける

Slide 137

Slide 137 text

Tom Mathews Making "Big Data" Work for 'Halo': A Case Study http://ai-wiki/wiki/images/d/d8/AI_Seminar_177th.pdf

Slide 138

Slide 138 text

位置検索システム

Slide 139

Slide 139 text

位置検索システム - キャラクターの性能に応じて - 地形毎に - リアルタイムで 最も適したポイントを見つけるシステム

Slide 140

Slide 140 text

No content

Slide 141

Slide 141 text

No content

Slide 142

Slide 142 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 143

Slide 143 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 144

Slide 144 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 145

Slide 145 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 146

Slide 146 text

M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013, https://www.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical

Slide 147

Slide 147 text

スパーシャルAI 空間解析 状況解析 位置検索技術 パス検索 スマートオブジェクト など多数 影響マップ など多数

Slide 148

Slide 148 text

スマートオブジェクト、スマートロケーション 物の方に人工知能を持たせて、物からキャラクターを操る仕組み

Slide 149

Slide 149 text

スマート環境アクター スマートオブジェクト エージェント スマートポイント スマートスペース エージェント エージェント 制御 制御 制御 ドア ドアノブ スペース オブジェクト(物) ポイント(座標)

Slide 150

Slide 150 text

エージェント 主体 客体 エージェント 主体 客体 転換 環境アクター スマート 環境アクター 主客転換制御

Slide 151

Slide 151 text

メタAI エージェント エージェント自律制御 スマート環境アクター制御 スマート環境アクター制御 スマートスペース スマートオブジェクト スマートポイント コミュニケーション コミュニケーション

Slide 152

Slide 152 text

同期 スマートシティ (物理世界) スパーシャルAI (空間AI) メタバース (デジタル世界) デジタルツイン空間 同期 スマートスペース

Slide 153

Slide 153 text

デジタルゲームAI入門③ (メタAI)

Slide 154

Slide 154 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能 MCS-AI動的 連携モデル

Slide 155

Slide 155 text

メタAIの歴史 1980 1990 2000 古典的メタAI 現代のメタAI キャラクターAI技術の発展 その歴史は古く、1980年代にまでさかのぼる。 その時代と現代のメタAIは、異なる点も多いので、 古典的メタAI、現代のメタAIと名づけて区別することにしよう。

Slide 156

Slide 156 text

(例)「ゼビウス」(ナムコ、1983) 敵出現テーブル巻き戻し 敵0 敵1 敵2 敵3 敵4 敵5 『あと面白い機能なんですけれど、 ゼビウスには非常に簡単なAIが組み込まれています。 「プレイヤーがどれくらいの腕か」というのを判断して、 出てくる敵が強くなるんです。 強いと思った相手には強い敵が出てきて、 弱いと思った相手には弱い敵が出てきます。 そういっ たプログラムが組み込まれています。 ゲームの難易度というのは「初心者には難しくて、上級者 には簡単だ」ということが、 ひとつの難易度で(調整を)やっていくと起きてしまうので、 その辺を何 とか改善したいな、ということでそういったことを始めてみたのですけれど、 お陰で割合にあまり上 手くない人でも比較的長くプレイできる、 うまい人でも最後のほうに行くまで結構ドラマチックに楽 しめる、 そういった感じになっています。』 - 遠藤雅伸(出演)、1987、「糸井重里の電視遊戯大展覧会」『遠藤雅伸ゼビウスセミナー』フジテレビ -

Slide 157

Slide 157 text

メタAIの歴史 1980 1990 2000 古典的メタAI 現代のメタAI キャラクターAI技術の発展 その歴史は古く、1980年代にまでさかのぼる。 その時代と現代のメタAIは、異なる点も多いので、 古典的メタAI、現代のメタAIと名づけて区別することにしよう。

Slide 158

Slide 158 text

メタAI(=AI Director)によるユーザーのリラックス度に応じた敵出現度 ユーザーの緊張度 実際の敵出現数 計算によって 求められた 理想的な敵出現数 Build Up …プレイヤーの緊張度が目標値を超えるまで 敵を出現させ続ける。 Sustain Peak … 緊張度のピークを3-5秒維持するために、 敵の数を維持する。 Peak Fade … 敵の数を最小限へ減少していく。 Relax … プレイヤーたちが安全な領域へ行くまで、30-45秒間、 敵の出現を最小限に維持する。 Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford. http://www.valvesoftware.com/publications.html より具体的なアルゴリズム

Slide 159

Slide 159 text

安全な領域までの道のり(Flow Distance) メタAIはプレイヤー群の経路を トレースし予測する。 - どこへ来るか - どこが背面になるか - どこに向かうか Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford. http://www.valvesoftware.com/publications.html

Slide 160

Slide 160 text

プレイヤーからの可視領域 可視領域(プレイヤーから見えている 部屋)では、敵のスパウニング(発生) はできない。 Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford. http://www.valvesoftware.com/publications.html

Slide 161

Slide 161 text

敵出現領域 背後 前方 Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford. http://www.valvesoftware.com/publications.html 前方と背後のプレイヤー群から見えてない部屋に、 モンスターを発生させる。

Slide 162

Slide 162 text

Procedural Generation in WarFrame • Warframe ではダンジョンが自動生成される。 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 163

Slide 163 text

Black Combination in WarFrame • ブロックを組み合わる • 完全に零からの生成 ではない。 このような生成のことを Semi-procedural と言う。 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 164

Slide 164 text

WarFrame における自動生成マップの 自動解析による自動骨格抽出 • 自動生成するだけでなく、自動生成したダンジョンを、自動解 析します。ここでは、トポロジー(形状)検出を行います。

Slide 165

Slide 165 text

WarFrame における自動生成マップの 自動解析によるナビゲーションデータ作成 抽出した骨格に沿って 自動的にナビゲーション・データを作成します。 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 166

Slide 166 text

スタートポイント、出口、目的地の 自動生成 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 167

Slide 167 text

ヒートマップ(影響マップ)を用いて ゲーム中にプレイヤーの周囲を自動解析 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed ヒートマップ(影響マップ)とは、対象(ここではプレイヤー)を中心に、位置に温度(影響度)を 与える方法です。距離に応じて減衰します。また時間が経つと、周囲に熱が拡散します。

Slide 168

Slide 168 text

Tactical Map の例 (影響マップ) (例)敵と自分の勢力をリアルタイムに計算する。 4 6 8 8 8 8 6 4 2 0 -1 -2 -4 -4 -4 -2 4 6 8 8 8 8 4 2 1 0 -2 -4 -4 -2 4 6 8 8 8 6 3 1 0 -2 -4 -4 -4 -2 4 6 8 8 8 6 6 4 1 0 -2 -4 -4 -2 2 4 6 8 6 6 4 4 0 -1 -2 -4 -4 -4 -2 1 2 4 6 6 4 2 2 -4 -5 -3 -3 -4 -4 -2 -1 3 3 3 3 4 2 2 0 -4 -5 -5 -8 -8 -6 -4 -2 3 3 2 2 2 0 -2 -4 -8 -10 -10 -8 -4 -2 3 3 3 2 2 1 0 -4 -8 -10 -10 -8 -8 -4 -2 2 2 2 2 1 1 0 -3 -8 -10 -10 -8 -8 -4 -2 1 1 1 1 0 0 -2 -4 -8 -8 -8 -8 -8 -8 -8 -8 0 0 0 0 0 -1 -1 -2 -5 -6 -6 -6 -8 -8 -8 0 0 0 0 -1 -2 -2 -2 -4 -4 -4 -6 -8 -8 -8 -8 0 0 0 0 -1 -2 -2 -2 -2 -2 -2 -2 -2 -2 -2 0 0 0 0 -1 -2 -2 -2 -2 -2 -2 -2 -2 -2 -2 -2 0 0 0 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1

Slide 169

Slide 169 text

ヒートマップ(影響マップ)を用いて ゲーム中にプレイヤーの周囲を自動解析 「ヒートが増加する=プレイヤーが近づく点」 「ヒートが減少する=プレイヤーが遠ざかる点」 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 170

Slide 170 text

アクティブ・エリアセット(Active Are Set) Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed アクティブ・エリアセットは、プレイヤーの周囲の領域で、 リアルタイムにメタAIがゲームを調整する領域

Slide 171

Slide 171 text

メタAIがアクティブ・エリアセット内で ゲームを調整する 「ヒートが増加する=プレイヤーが近づく点」なので、モンスターを生成する。 「ヒートが減少する=プレイヤーが遠ざかる点」なので、モンスターを停止する。 Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe (GDC2015) http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed

Slide 172

Slide 172 text

StarCraft~StarCraft2における 人工知能 (DeepMind, 2019) - 記号主義からディープラーニングへ

Slide 173

Slide 173 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 174

Slide 174 text

StarCraftのAI • Santiago Ontañon, Gabriel Synnaeve, Alberto Uriarte, Florian Richoux, David Churchill, et al.. • “A Survey of Real-Time Strategy Game AI Research and Competition in StarCraft”. IEEE Transactions on Computational Intelligence and AI in games, IEEE Computational Intelligence Society, 2013, 5(4), pp.1-19. hal- 00871001 • https://hal.archives-ouvertes.fr/hal-00871001

Slide 175

Slide 175 text

FLASH IS BACK! RECENT MATCH vs JAEDONG! on Polypoid - StarCraft - Brood War – 2023 https://www.youtube.com/watch?v=WMue4ublyJc

Slide 176

Slide 176 text

StarCraftの7つのアーキテクチャ (2010-2020)

Slide 177

Slide 177 text

戦略思考 ハイレベル、抽象的 3分~ 知識収集と 学習 敵のモデル化 戦略決定 部隊形成 命令プランの構築 戦術思考 中間レベル 30秒~1分 スカウティング 戦闘タイミングと 位置 ユニットと建築物 の配置 反射コントロール 低レベル、物理的 ~1秒 小ユニット マルチエージェン パス検索 StarCraft 一般的なアーキテクチャ

Slide 178

Slide 178 text

戦闘 ゴール マネージャー ユニットグループ ベイジアン・ネット BroodWarBotQ 仲介モジュール 知能 マップ マネージャー 技術推定 ユニット フィルター 資源管理 ワーカー マネージャー 基地 マネージャー 生産 マネージャー 建築 マネージャー StarCraft BroodWarQ Bot アーキテクチャ

Slide 179

Slide 179 text

知能 建築命令マネージャー スカウト マネージャー 資源 マネージャー マクロ マネージャー 拡張 マネージャー 供給 マネージャー 部隊 マネージャー 封鎖経路 マネージャー 戦略 戦術 タスクマネージャー 建築設置 モジュール タスク n StarCraft SkyNet Bot アーキテクチャ

Slide 180

Slide 180 text

資源管理 戦闘 部隊マネージャー 防御マネージャー 戦闘マネージャー AIUR ムード マネージャー 知能 仲介モジュール スカウト マネー ジャー 情報マネージャー ワーカー マネージャー 基地 マネージャー 生産 マネージャー 建築 マネージャー スパイ マネー ジャー 消費 マネージャー StarCraft AIUR Bot アーキテクチャ

Slide 181

Slide 181 text

StarCraft~StarCraft2における 人工知能 (DeepMind, 2019) Oriol Vinyals, et al., “StarCraft II: A New Challenge for Reinforcement Learning”, https://arxiv.org/abs/1708.04782 PySC2 - StarCraft II Learning Environment https://github.com/deepmind/pysc2

Slide 182

Slide 182 text

StarCraft 2: Google DeepMind AlphaStar (A.I.) vs Pro Gamer! https://www.youtube.com/watch?v=FWbVseLiopw

Slide 183

Slide 183 text

https://deepmind.com/blog/article/alphastar-mastering-real-time-strategy-game-starcraft-ii

Slide 184

Slide 184 text

StarCraft II API StarCraft II バイナリー PySC2 エージェント アクション select_rect(p1, p2) or build_supply(p3) or … 観察 資源 可能なアクション 建築命令 スクリーン (ゲーム情報) ミニマップ (特定の情報) 報酬 -1/0/+1 SC2LE

Slide 185

Slide 185 text

評価値 Value Network Baseline features アクション・タイプ ディレイ ユニット選択 命令発行 ターゲット選択 Residual MLP MLP MLP Pointer Network Attention D 分散表現 MLP 分散表現 MLP 分散表現 MLP Embedding MLP コア Deep LSTM スカラー エンコーダー MLP エンティティ エンコーダー トランス フォーマー 空間 エンコーダー ResNet ゲーム パラメーター群 エンティティ ミニマップ

Slide 186

Slide 186 text

Oriol Vinyals, et al., “StarCraft II: A New Challenge for Reinforcement Learning”, https://arxiv.org/abs/1708.04782 PySC2 - StarCraft II Learning Environment https://github.com/deepmind/pysc2

Slide 187

Slide 187 text

Oriol Vinyals, et al., “StarCraft II: A New Challenge for Reinforcement Learning”, https://arxiv.org/abs/1708.04782 PySC2 - StarCraft II Learning Environment https://github.com/deepmind/pysc2

Slide 188

Slide 188 text

日本におけるゲームセンターの対戦文化の流れ(1980年代~) アメリカを中心とするFPS対戦の流れ(2000年前後~) 韓国におけるeスポーツ文化の流れ(1997年~) 世界的なMOBAスタイルの チーム対戦の流れ(2010年~) 1985 1990 1995 2007 ⅬAN ゲームセンターの 対戦台 インターネット 高速インターネット・動画配信 実際の現場でギャラリー観戦 テレビなどで観戦 インターネットで観戦 ゲーム聴衆 の誕生

Slide 189

Slide 189 text

Dota2 eSportsで大人気 OpenAI Five: Dota Gameplay https://www.youtube.com/watch?v=UZHTNBMAfAA 解説:『Dota 2』における人間側のチャンピオンチームとAIチームの戦い https://alienwarezone.jp/post/2316

Slide 190

Slide 190 text

OpenAI Five https://openai.com/projects/five/ Christopher Berner, et al.,“Dota 2 with Large Scale Deep Reinforcement Learning” https://arxiv.org/abs/1912.06680

Slide 191

Slide 191 text

・アクションゲーム ・物語ゲーム

Slide 192

Slide 192 text

ゲームには2つのルーツがある ・アクションゲーム ・物語ゲーム どちらもその誕生に人工知能が深く関係している

Slide 193

Slide 193 text

第二章 第一節 アクションゲーム 第二節 物語ゲーム

Slide 194

Slide 194 text

TRPG『Dungeons & Drangons』 デジタルゲームの前進となるのは、テーブルトークRPG。「ゲームブック」を題材として、 ゲームマスターがストーリー、キャラクター、ゲーム設定を作り出して、ゲームを語りながら進める。

Slide 195

Slide 195 text

ELIZA(イライザ) (1966年) • 対話型コンピューティングの初めての例 • 簡単な構文解析 • 抽出した語句から質問文を形成 • 対話エージェントのはじまり • 自然言語処理の発展 (自然言語処理は 1950年代から発展している。特に自動翻 訳など) https://ja.wikipedia.org/wiki/ELIZA

Slide 196

Slide 196 text

Eliza →→→→ ChatGPT Eliza ChatGPT https://openai.com/blog/chatgpt

Slide 197

Slide 197 text

テキストベースのRPG(CRPGの起源) (Don Daglow and Students in Claremont Graduate University, 1975) カウンセラーとしての対話エージェント (ジョセフ・ワイゼンバウム、1966) ELIZA Dungeon Ecala 拡 張 DEC社のPDP-10上で動くELIZAの拡張 (Don Daglow、のちに Neverwinter Nightを制作)

Slide 198

Slide 198 text

ELIZA Before Siri and Alexa, there was ELIZA https://www.youtube.com/watch?v=RMK9AphfLco&t=31s

Slide 199

Slide 199 text

テキストアドベンチャーゲーム(1970年代) • テキストベースでプレイヤーと対話する • あらかじめ用意されたスクリプトと、場合分けによって進む • ゲームとプレイヤーとの対話とみなすことができる https://store.steampowered.com/app/570580/Zork_Anthology/?l=japanese © 1994 Activision Publishing, Inc.

Slide 200

Slide 200 text

Let's Play Zork I 01 Deutsch, German https://www.youtube.com/watch?v=sjEoB8Dj0tg

Slide 201

Slide 201 text

ゲーム内のエージェントと会話 ユーザー 影響を与える 対話をする 応答した行動をする C (語りの主体) C C キャラクター 語り手 ナラティブの発生 (間接的な語り)

Slide 202

Slide 202 text

ミステリーハウス (シエラ・オンライン、1980) • 文章+画像 • テキストアドベンチャーゲームに画像を用いた初めてのゲーム https://ja.wikipedia.org/wiki/%E3%83%9F%E3%82%B9%E3%83%86%E3%83%AA%E3%83%BC%E3%83%8F%E3%82%A6%E3%82%B9

Slide 203

Slide 203 text

ゲーム内のエージェントと会話 ユーザー 影響を与える 対話をする 応答した行動をする C (語りの主体) C 画像 キャラクター 語り手 ナラティブの発生 (間接的な語り)

Slide 204

Slide 204 text

シムシティ(EA, 1989) 「大事なのは街を構成する建物とか道路じゃなくって、 そこでどんな活動が行われているかってことだと思うんだ 道路を車が走り、電車が動き、人々が動き回り、 常に要素が変化し続ける“動きのある”システム。」 「要素にはそれぞれ他の要素に与える影響、他の要素から受け る影響など、いろいろなデータが含まれていて、いったんこれ が置かれると、他の要素と相互に関係を持ち始めて状態が変化 することになるんだ。」 『ウィル・ライトが明かすシムシティーのすべて』 多摩豊 角川書店 1990 https://www.ea.com/ja-jp/games/simcity © 2021 Electronic Arts Inc.

Slide 205

Slide 205 text

最上層 ユーザーのアクションの単位の1マス <ユーザー・エディット・ウィンドウ> 第二階層 (2x2マスを1単位とする) 人口密度、交通渋滞、環境汚染度、ランドバ リュー、犯罪発生率を計算し伝播 第三階層 (4x4マスを1単位とする) 地形の状況を計算し伝播 第四階層 (8x8マスを1単位とする) 人口増加率、消防署、警察署、消防署の影響 力、警察署の影響力を計算し伝播 影響度 計算 影響度 伝播

Slide 206

Slide 206 text

ゲーム内のエージェントと会話 ユーザー 影響を与える 操作する 街全体が 応答した行動をする U 街のシステム (語りの主体) U U 操作ユニット 語り手 ナラティブの発生 (間接的な語り)

Slide 207

Slide 207 text

Creatures(Millennium, 1996) • 8000ノードのニューラルネットワーク • 物の名前とアクションを学習する ※出典Grand, Steve; Cliff, Dave; Mahotra, Anil. (1996). "Creatures: Artificial Life Autonomous Software Agents for Home Entertainment" (PDF). Millennium Technical Report 9601; University of Sussex Technical Report CSRP434. Retrieved 2012-11-12. http://mrl.snu.ac.kr/courses/CourseSyntheticCharacter/grand96creatures.pdf Ⓒ Millennium Interactive, Ltd.

Slide 208

Slide 208 text

Creatures (Windows 3.1, 1996) [Gameplay] https://www.youtube.com/watch?v=bj7VTa1TL8Q

Slide 209

Slide 209 text

ローブ1 ローブ2 ニューロン

Slide 210

Slide 210 text

知能を構成するローブの構成 意思決定ローブ コンセプトローブ (640ニューロン) 認識ローブ 注意 刺激源 名詞 動詞 いろいろ Drives

Slide 211

Slide 211 text

ゲーム内のエージェントと会話 ユーザー 影響を与える 対話をする 応答した行動をする 成長する AI キャラクター ナラティブの発生 (直接的な語り) ゲーム システム 語り手 キャラクター

Slide 212

Slide 212 text

森川幸人, 「テレビゲームへの人工知能技術の利用」, 人工知能学会誌vol.14 No.2 1999-3 http://www.ai-gakkai.or.jp/jsai/whatsai/PDF/article-iapp-7.pdf http://www.1101.com/morikawa/1999-04-10.html アストロノーカ(muumuu、1998年)

Slide 213

Slide 213 text

遺伝的アルゴリズムの応用 集団を一定の方向に進化させる方法 最初の世代 新世代 (100~世代後) … 世代を経て進化させる 1つの世代が次の世代を交配によって産み出す

Slide 214

Slide 214 text

遺伝的アルゴリズムの仕組み 遺伝子 次世代 親① 親② 母集団から優秀な親を 2体ピックアップ 遺伝子を掛け合わせる 次世代の子供を産み出す (selection) (crossover) (production) 現世代 遺伝子 このサイクルをくり返すことで世代を進めて、望ましい集団を産み出す 遺伝子 遺伝子

Slide 215

Slide 215 text

ゲームシステムとしての工夫 • 遺伝的アルゴリズムは集団に対するアルゴリズム →1体のトラップバトルの裏で他の20体も同じトラップバトルをして、 全体として世代交代をさせている。 全体の適応度の平均値 1日の適応度の伸び 世代交代数

Slide 216

Slide 216 text

ゲーム内のエージェントと会話 ユーザー 影響を与える 対話をする 応答した行動をする 成長する AI キャラクター ナラティブの発生 (間接的な語り) ゲーム システム 語り手 キャラクター

Slide 217

Slide 217 text

シーマン(SEGA, 1999) 斎藤 由多加 聞き手:大澤 博隆、三宅 陽一郎 構成:高橋 ミレイ シーマンは来たるべき会話型エージェントの福音となるか?:斎藤由多加インタビュー Will Seaman Lead AI Technology for Interactive Agent? : Yutaka Saito Interview https://jsai.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=8633&item_no=1&page_id=13&block_id=23

Slide 218

Slide 218 text

シーマンの会話 • ルールベース (巨大な分岐)→ 評価ベースへ • メロディ―言語 同じ言葉でも、発音によって意味が異なる 会話を成り立たせるには、文字だけではわからない • 水族館でデモ→不評 • 当時の音声認識デバイスの限界 • 聴こえなかったら「あ?聴こえねえよ」とやり返す→好評

Slide 219

Slide 219 text

メロディ言語 • 「元気」でも発音一つで意味が異なる • さまざまなバリエーションを用意している • 間をコントロールする → 間を空けることで意味を持たせる • 「○○じゃねーって言っただろ?」の○○の中にいろんな動詞 を入れる

Slide 220

Slide 220 text

斎藤さんのお言葉 • もっと言うと“頷くだけ”でいい , .“頷く”というのは,情報的には無で すよね.でも,そこを共有する仕組みに我々が目を向けていかない限り, 冒頭でおっしゃった,人間と親しく会話をする人工知能をつくる手立ては 見つからないと思います.エージェントというと検索エンジンの代理人み たいに思っておられるんじゃないかと思いますが,何も検索しない,ただ 「マジか…」と言ってくれる 斎藤 由多加 聞き手:大澤 博隆、三宅 陽一郎 構成:高橋 ミレイ シーマンは来たるべき会話型エージェントの福音となるか?:斎藤由多加インタビュー Will Seaman Lead AI Technology for Interactive Agent? : Yutaka Saito Interview https://jsai.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=8633&item_ no=1&page_id=13&block_id=23

Slide 221

Slide 221 text

ゲーム内のエージェントと会話 ユーザー 影響を与える 対話をする 応答した行動をする 成長する AI キャラクター ナラティブの発生 (直接的な語り) ゲーム システム 語り手 キャラクター

Slide 222

Slide 222 text

The Sims(シム・ピープル, EA, Maxis, 2000) • 自律型エージェントの作る社会を観察するゲーム Ken Forbus, “Simulation and Modeling: Under the hood of The Sims” (NorthWerstern大学、講義資料) http://www.cs.northwestern.edu/%7Eforbus/c95-gd/lectures/The_Sims_Under_the_Hood_files/frame.htm Richard Evans, Modeling Individual Personalities in The Sims 3, GDC 2010 http://www.gdcvault.com/play/1012450/Modeling-Individual-Personalities-in-The

Slide 223

Slide 223 text

The Sims 1 - long gameplay #1 (no commentary) https://www.youtube.com/watch?v=zy0ButIPqq4

Slide 224

Slide 224 text

The Sims における「モチーフ・エンジン」 • AIの人格モデル Ken Forbus, “Simulation and Modeling: Under the hood of The Sims” (NorthWerstern University) http://www.cs.northwestern.edu/%7Eforbus/c95-gd/lectures/The_Sims_Under_the_Hood_files/frame.htm Data - Needs - Personality - Skills - Relationships Sloppy - Neat Shy - Outgoing Serious - Playful Lazy - Active Mean - Nice Physical - Hunger - Comfort - Hygiene - Bladder Mental - Energy - Fun - Social - Room Motive Engine Cooking Mechanical Logic Body Etc.

Slide 225

Slide 225 text

最適(=最大効用)な行動を選択する • [原則] 周囲の対象に対する、あらゆる可能な行動から、 総合的な効用 (=Mood) を最大化する行動を選択する Hunger +20 Comfort -12 Hygiene -30 Bladder -75 Energy +80 Fun +40 Social +10 Room - 60 Mood +18 - Urinate (+40 Bladder) - Clean (+30 Room) - Unclog (+40 Room) Mood +26 - Take Bath (+40 Hygiene) (+30 Comfort) - Clean (+20 Room) Mood +20 Bathtub Toilet Ken Forbus, “Simulation and Modeling: Under the hood of The Sims” (NorthWerstern大学、講義資料) http://www.cs.northwestern.edu/%7Eforbus/c95-gd/lectures/The_Sims_Under_the_Hood_files/frame.htm

Slide 226

Slide 226 text

ムードの計算方法と各パラメーターのウェイトグラフ Mood = W_Hunger(X_Hunger) * X_Hunger + W_Engergy(X_Energy) * X_Energy + … -100 0 100 -100 0 100 -100 0 100 -100 0 100 -100 0 100 -100 0 100 W_Hunger W_Energy W_Comfort W_Fun W_Hygiene W_Social W_Bladder W_Room -100 0 100 -100 0 100 Ken Forbus, “Simulation and Modeling: Under the hood of The Sims” (NorthWerstern大学、講義資料) http://www.cs.northwestern.edu/%7Eforbus/c95-gd/lectures/The_Sims_Under_the_Hood_files/frame.htm

Slide 227

Slide 227 text

効用(Utility)の計算の仕方 W_Hunger X_Hunger W_Hunger(-80) -80 60 W_Hunger(60)

Slide 228

Slide 228 text

効用(Utility)の計算の仕方 Hunger degree at -80 = W_Hunger(-80)*(-80) Hunger degree at 60 = W_Hunger(60)*(60) Δ = W_Hunger(60)*(60) - W_Hunger(-80)*(-80) Utility for hunger W_Hunger X_Hunger W_Hunger(-80) -80 60 W_Hunger(60) 90 W_Hunger(90)

Slide 229

Slide 229 text

限界効用逓減の法則 Δ(-80 → 60)=W_Hunger(60)*(60) - W_Hunger(-80)*(-80) Δ (60→90) =W_Hunger(90)*(90) - W_Hunger(60)*(60) Δ(-80 → 60) は Δ(60→90) よりずっと大きい Utility for hunger W_Hunger X_Hunger W_Hunger(-80) -80 60 W_Hunger(60) 90 W_Hunger(90)

Slide 230

Slide 230 text

限界効用逓減の法則 ビールは一杯目が一番おいしい ある程度満たされたものを満たすより、 満たされないものをある程度満たす方が大きな満足をもたらす Utility for hunger W_Hunger X_Hunger W_Hunger(-80) -80 60 W_Hunger(60) 90 W_Hunger(90)

Slide 231

Slide 231 text

ゲーム内のエージェントと会話 ユーザー 影響を与える 対話をする 応答した行動をする 成長する AI キャラクター ナラティブの発生 (直接的な語り) ゲーム システム 語り手 キャラクター

Slide 232

Slide 232 text

CADIA Populus • 「EveOnline」を作っているCCPは、 レイキャビク大学と共同でエージェント たちの自然な振る舞いを研究した。 http://populus.cs.ru.is/node/116 CADIA populous (Claudio Pedica) https://www.youtube.com/watch?v=yCw8hB57h4w

Slide 233

Slide 233 text

HASGE Project (Reykjavik Univ, CCP) http://cadia.ru.is/wiki/public:socialgame:main

Slide 234

Slide 234 text

CADIA Populus Social Engine (2010) (Hannes Vilhjalmsson) https://www.youtube.com/watch?v=qz6X9BdxPBs

Slide 235

Slide 235 text

F-formation (Kendon, 1984) • 人と人が向い合うときに 形成する立ち位置 Paul Marshall,Yvonne Rogers,Nadia Pantidi Using F-formations to analyse spatial patterns of interaction in physical environments http://mcs.open.ac.uk/pervasive/pdfs/MarshallCSCW2011.pdf

Slide 236

Slide 236 text

ゲーム内のエージェントと会話 ユーザー 影響を与える 対話をする 応答した行動をする 成長する AI キャラクター ナラティブの発生 (直接的な語り) 語り手 キャラクター

Slide 237

Slide 237 text

ゲーム内のエージェントと会話 ユーザー 影響を与える コマンド 応答した行動をする 仲 間 NPCを通したバトル (語りの主体) →メタAI 敵 C 仲間キャラクター・敵キャラクター 語り手 ナラティブの発生 (間接的な語り)

Slide 238

Slide 238 text

対話エージェントの歴史 Creatures シーマン LEFT 4 DEAD The Last of US FFXV テキスト アドベン チャー 箱庭・シム系 ゲーム内 会話系 アストロ ノーカ 対話・キャラクター育成系 多数の ゲーム イラ イザ エミー2 パピーラブ The Sims ワンダー プロジェクト J1,2 リトルコン ピューター ピープル どこでも いっしょ

Slide 239

Slide 239 text

NUVERSE、GPT3をゲームに組み込む [GDC 2023]GPT-3でNPCの会話を生成。Nuverseが「アース:リバイバル」でチャレンジする,新テクノロ ジーによるゲーム開発の“新たな一歩” https://www.4gamer.net/games/651/G065105/20230325007/

Slide 240

Slide 240 text

Earth revival (Nuverse, 中国のゲーム) • 800ms以下で会話を生成 • アニメーション生成(10 から 20秒の) • …つまり20 時間のコンテンツをわずか48分で生成 • GPT3 • 音声生成 Nuverse lets AI do all the talking and moving of NPCs in Earth: Revival https://premortem.games/2023/03/22/nuverse-lets-ai-do-all- the-talking-and-moving-of-npcs-in-earth-revival/ ジェネレーティブAIでゲーム開発支援! GDCで発表されたリア ルな事例や取り組みを紹介 https://www.famitsu.com/news/202303/24297009.html

Slide 241

Slide 241 text

ChatGPT と Stable Diffusion を用いた RPG: Tales of Syn • How AI-assisted RPG Tales of Syn utilizes Stable Diffusion and ChatGPT to create assets and dialogues • https://gameworldobserver.com/2023/03/06/tales-of-syn-ai- rpg-stable-diffusion-chatgpt-game • Tales of Syn • https://talesofsyn.com/ • https://twitter.com/_hackmans_/status/1624501399383072768

Slide 242

Slide 242 text

ChatGPT と Stable Diffusion を用いた RPG: Tales of Syn • https://twitter.com/_hackmans_/status/1624501399383072768 • https://talesofsyn.com/

Slide 243

Slide 243 text

Tales of Syn Game - NPC Chat GPT3 Prototype (Tales of Syn) https://www.youtube.com/watch?v=ejw6OI4_lJw

Slide 244

Slide 244 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 245

Slide 245 text

Facebook AIにおけるゲーム会話研究 I (2019) マインクラフトを用いた対話学習(2019)

Slide 246

Slide 246 text

LIGHT(facebook.ai, 2019) • テキストアドベンチャー フレームワーク • クラウドワーカーを用いてゲーム設 計を募集 • クラウドワーカーに役を割り当てて 会話チャットでデータ収集 • この上で自然言語会話を研究 https://parl.ai/projects/light/ https://ai.facebook.com/blog/introducing-light-a-multiplayer-text-adventure-game-for-dialogue-research/

Slide 247

Slide 247 text

https://parl.ai/projects/light/

Slide 248

Slide 248 text

(facebook ai) Prithviraj Ammanabrolu, Jack Urbanek, Margaret Li, Arthur Szlam, Tim Rocktäschel, Jason Weston How to Motivate Your Dragon: Teaching Goal-Driven Agents to Speak and Act in Fantasy Worlds https://arxiv.org/abs/2010.00685

Slide 249

Slide 249 text

https://parl.ai/projects/light/

Slide 250

Slide 250 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 251

Slide 251 text

Microsoft Researchにおけるゲーム会話研究 テキストアドベンチャーゲームを利用した対話学習 (2019)

Slide 252

Slide 252 text

TextWorld • マイクロソフトが構築したテキストアドベンチャーの学習環境 • 50ほどのテキストアドベンチャーを内包している • TextWorld: A Learning Environment for Text-based Games • https://arxiv.org/abs/1806.11532 • • TextWorld: A learning environment for training reinforcement learning agents, inspired by text-based games • https://www.microsoft.com/en-us/research/blog/textworld-a-learning-environment- for-training-reinforcement-learning-agents-inspired-by-text-based-games/ • • Getting Started with TextWorld • https://www.youtube.com/watch?v=WVIIigrPUJs https://www.microsoft.com/en-us/research/project/textworld/

Slide 253

Slide 253 text

TextWorld TextWorld: A Learning Environment for Text-based Games https://arxiv.org/abs/1806.11532

Slide 254

Slide 254 text

TextWorld TextWorld: A Learning Environment for Text-based Games https://arxiv.org/abs/1806.11532

Slide 255

Slide 255 text

ゲーム内のエージェントと会話 ユーザー 影響を与える コマンド 応答した行動をする (語りの主体) 語り手

Slide 256

Slide 256 text

年 企業 テーマ Open 2003 Microsoft 「Teo Feng」における強化学習 2005 Microsoft 「Forzamotor Sports」における強化学習 2013 DeepMind AtariのゲームをDQNで学習 〇 2015 DeepMind 囲碁 AlphaGO 2017 AnyLogic 倉庫・機械などモデルのシミュレーション Microsoft 「パックマン」多報酬学習 Hybrid Reward Architecture for Reinforcement Learning 〇 2019 Google 「サッカーシミュレーター」による強化学習の研究 〇 DeepMind 「Capture the flag」によるディープラーニング学習 〇 Microsoft 「AirSim」ドローンシミュレーター 〇 Nvidia 「ドライビングシミュレーター」 Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇 facebook 「CraftAssist」マインクラフト内で会話研究 〇 CarMelon カーネギーメロン大学「MineRL」マインクラフトを使ったAIコンテスト 〇 facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇 OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇 DeepMind 「StarCraft2」AlphaStar 〇 DeepMind 「Capture the Flag」QuakeIII エンジン 〇 2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇 DeepMind 「Agent57」AtariのほとんどのゲームをDQN+LSTMなどで学習 〇 OpenAI 「HIDE AND SEEK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇

Slide 257

Slide 257 text

Microsoft: Malmo • エージェントを学習させる環境を提供 • https://www.microsoft.com/en-us/research/project/project-malmo/ • https://blogs.microsoft.com/ai/project-malmo-using-minecraft-build-intelligent-technology/ • チュートリアル • https://techcommunity.microsoft.com/t5/azure-ai/introducing-reinforcement-learning-on- azure-machine-learning/ba-p/1403028

Slide 258

Slide 258 text

facebook:「CraftAssist」(2019) • マインクラフトでプレイヤーと共同作業可能なAIを 実装するためのオープンソースプラットフォーム https://gigazine.net/news/20190719-craftassist- collaborative-ai-minecraft/ • テキスト会話によって、エージェント(キャラク ター)に意味を解釈させる。「青い家を建てろ」な ど。 CraftAssist: A Framework for Dialogue-enabled Interactive Agents - Facebook Research https://research.fb.com/publications/craftassist-a-framework-for-dialogue-enabled- interactive-agents/ Open-sourcing CraftAssist, a platform for studying collaborative AI bots in Minecraft https://ai.facebook.com/blog/craftassist-platform-for-collaborative-minecraft-bots/ Mojang © 2009-2021.

Slide 259

Slide 259 text

カーネギーメロン大学「MineRL」 • カーネギーメロン大学が NeurIPSで主催するマインクラフトを題材にした • 強化学習コンテストのフレームワーク • https://ai-scholar.tech/articles/treatise/minerl-ai-353 • https://minerl.io/competition/ • https://www.aicrowd.com/challenges/neurips-2020-minerl-competition • 論文 • https://arxiv.org/pdf/1907.13440.pdf • https://arxiv.org/abs/1904.10079 • https://www.microsoft.com/en-us/research/project/project-malmo/ • https://minerl.io/docs/ • https://slideslive.at/38922880/the-minerl-competition?ref=search

Slide 260

Slide 260 text

カーネギーメロン大学「MineRL」 MineRL: A Large-Scale Dataset of Minecraft Demonstrations https://arxiv.org/pdf/1907.13440.pdf Mojang © 2009-2021.

Slide 261

Slide 261 text

ゲーム内のエージェントと会話 ユーザー 影響を与える コマンド 応答した行動をする C 仲間キャラクター・敵キャラクター

Slide 262

Slide 262 text

ロードマップ ゲームとユーザーの間の 応答の意味を問い直す 自然言語会話を含む ユーザーとゲームの間の 新しい関係を模索する ゲームやキャラクターが 自律的にユーザーと インタラクションする 現在~2024 現在 2025~2030 単に自然言語処理を導入するのではない。 ゲーム産業が独自に築き上げてきた対話エージェントと融合させる。

Slide 263

Slide 263 text

第三部 ゲームを作り出す人工知能

Slide 264

Slide 264 text

ゲームと人工知能の関係 ゲームAI ゲームを外側から プレイするAI ゲーム内側から 構成するAI 将棋、チェス、囲碁… アカデミックで研究されるAI アカデミックではゲームを製作する、 ということはなかなかできない・しない マリオ、ゼルダ、フォートナイト 産業で開発されるAI ゲームを構成するAI ゲームを作り出す 人工知能 ゲームを管理する人工知能 ゲームを製作する人工知能

Slide 265

Slide 265 text

ジェネレーティブAI

Slide 266

Slide 266 text

プロシージャル技術(自動生成技術) ゲーム内の自動生成技術は、メタAIに属する技術

Slide 267

Slide 267 text

ブラウン運動から地形生成 ロバート・ブラウン博士によって、1827年に発見された現象。 微粒が媒質(液体)の中で行う不規則な運動。 アインシュタイン博士によって、熱運動する媒質の不規則な 衝突によって引き起こされると説明された。 http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95 宮田一乗「プロシージャル技術の動向」(CEDEC 2008)

Slide 268

Slide 268 text

ブラウン運動から地形生成 (1987) http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95 http://www.kenmusgrave.com

Slide 269

Slide 269 text

ブラウン運動から地形生成 (1987) http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95 http://www.kenmusgrave.com

Slide 270

Slide 270 text

NO MAN’S SKY (Hello Games, 2016) http://www.no-mans-sky.com/ 宇宙、星系、太陽系、惑星を自動生成する。

Slide 271

Slide 271 text

FarCry2 (Dunia Engine ) デモ 草原自動生成 時間システム 樹木自動生成 動的天候システム 動的天候システム http://www.farcry2-hq.com/downloads,18,dunia-engine-nr1.htm

Slide 272

Slide 272 text

Far Cry 2 Dunia Engine - Growing Vegetation (Far Cry HQ) https://www.youtube.com/watch?v=FI3oR6vqn1Q

Slide 273

Slide 273 text

ブラウン運動 ロバート・ブラウン博士によって、1827年に発見された現象。 微粒が媒質(液体)の中で行う不規則な運動。 アインシュタイン博士によって、熱運動する媒質の不規則な 衝突によって引き起こされると説明された。 http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95

Slide 274

Slide 274 text

地形自動生成 Jacob Olsen, Realtime Procedural Terrain Generation http://oddlabs.com/download/terrain_generation.pdf 2次元中点変位法 ボロノイ図 ノイズ法(濃い=低い、白い=高い) + =

Slide 275

Slide 275 text

Ken Musgrave http://www.kenmusgrave.com/

Slide 276

Slide 276 text

Terragen(Planetside Software) 風景、自動生成生成ソフト http://www.planetside.co.uk/terragen/ 海外のゲームや映画の背景として利用されている

Slide 277

Slide 277 text

Age of Empires III における地形自動生成 西川善司, 「3DゲームファンのためのAGE OF EMPIRESエンジン講座(後編)こだわりの影生成と算術合成 されるディテール、次回作はXbox2?」, GAME Watch, 2005

Slide 278

Slide 278 text

L-system による街の自動生成 City Engine(central pictures) Yoav I H Parish, Pascal Müller http://www.centralpictures.com/ce/tp/paper.pdf http://www.centralpictures.com/ce/ George Kelly, Hugh McCabe, A Survey of Procedural Techniques for City Generation http://www.gamesitb.com/SurveyProcedural.pdf

Slide 279

Slide 279 text

https://www.youtube.com/watch?v=FI3oR6vqn1Q

Slide 280

Slide 280 text

https://www.youtube.com/watch?v=NfizT369g60

Slide 281

Slide 281 text

https://www.youtube.com/watch?v=FzoY062kY1s

Slide 282

Slide 282 text

アメリカ大陸のデータから地形生成(Eidos) https://www.eidosmontreal.com/news/worldgen-painting-the-world-one-layer-at-a-time/

Slide 283

Slide 283 text

L-system による街の自動生成 City Engine(central pictures) Yoav I H Parish, Pascal Müller http://www.centralpictures.com/ce/tp/paper.pdf http://www.centralpictures.com/ce/ George Kelly, Hugh McCabe, A Survey of Procedural Techniques for City Generation http://www.gamesitb.com/SurveyProcedural.pdf

Slide 284

Slide 284 text

VITRUVIO CityEngine Plugin for Unreal Engine https://esri.github.io/cityengine/vitruvio

Slide 285

Slide 285 text

SimCity 4 Engine, Glassbox https://www.youtube.com/watch?v=tKOgo7EFl_w

Slide 286

Slide 286 text

ゲーム自動生成 [参考文献] Cameron Browne,“Evolutionary Game Design”, SpringerBriefs in Computer Science, 2011

Slide 287

Slide 287 text

ゲーム自動生成 [参考文献] Cameron Browne,“Evolutionary Game Design”, SpringerBriefs in Computer Science, 2011

Slide 288

Slide 288 text

ゲーム自動生成 [参考文献] Cameron Browne,“Evolutionary Game Design”, SpringerBriefs in Computer Science, 2011

Slide 289

Slide 289 text

評価 選 択 交叉 突然変異 ルール チェック 整合性 がある か? ポリシー 選択 速度が 遅い? ゴミ 箱 テストプ レイ 前と似て いる 引き分け になり やすい 母集団 Mark J. Nelson, “Bibliography: Encoding and generating videogame mechanics”, IEEE CIG 2012 tutorial URL https://www.kmjn.org/notes/generating_mechanics_bibliography.html Cameron Browne,“Evolutionary Game Design”, SpringerBriefs in Computer Science, 2011 URL https://www.springer.com/jp/book/9781447121787

Slide 290

Slide 290 text

ゲーム自動生成 https://jellyjellycafe.com/games/yabalath

Slide 291

Slide 291 text

PCGML PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 292

Slide 292 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 293

Slide 293 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 294

Slide 294 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 295

Slide 295 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212 PCGRL参考 • https://twitter.com/togelius/status/1222038094507102208 • https://twitter.com/i/status/1222038094507102208

Slide 296

Slide 296 text

PCGRL: Procedural Content Generation via Reinforcement Learning Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius https://arxiv.org/abs/2001.09212

Slide 297

Slide 297 text

https://medium.com/deepgamingai/game-level-design-with-reinforcement-learning-52b02bb94954

Slide 298

Slide 298 text

PCGRL参考 • https://twitter.com/togelius/status/1222038094507102208 • https://twitter.com/i/status/1222038094507102208

Slide 299

Slide 299 text

人間が製作し、 人工知能がチェックする Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 300

Slide 300 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 301

Slide 301 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 302

Slide 302 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 303

Slide 303 text

CoG 2021: Adversarial Reinforcement Learning for Procedural Content Generation SEED – Electronic Arts https://www.youtube.com/watch?v=kNj0qcc6Fpg

Slide 304

Slide 304 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 305

Slide 305 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 306

Slide 306 text

Adversarial Reinforcement Learning for Procedural Content Generation Linus Gisslén, Andy Eakins, Camilo Gordillo, Joakim Bergdahl, Konrad Tollmar https://arxiv.org/abs/2103.04847

Slide 307

Slide 307 text

メタバースと ジェネレーティブAI

Slide 308

Slide 308 text

クレジットカードによる オンライン決済 オンライン上の少額決済 (マイクロトランザクション) ブロックチェーン、仮想通貨 の普及 e-コマースの 普及 ソーシャル ゲームの普及 メタバースの 普及 お金の形の変化 インターネットの形の変化 2005 2015 経済原理がメタバースを再生させる

Slide 309

Slide 309 text

運営元 ポイント お金 ユーザー ポイント を購入 ユーザー お金 仮想通貨 運営元 ポイントを使用 アバター アバター メタバース デジタルゲーム 経済から見たゲームとメタバース

Slide 310

Slide 310 text

ゲーム世界 プレイヤー (主人公) プレイする バーチャル アイドル プロデューサー 応援する・ プロデュース する ゲーム世界 (eSports) 観戦者 観戦する メタバース 一参加者 生産する デジタル世界への参加の仕方の変化 デジタル空間への参加の仕方の変化

Slide 311

Slide 311 text

メタバース=ゲーム空間の解放 オンラインゲーム

Slide 312

Slide 312 text

生産者 NFTオンラインマー ケットプレイスなど、 取り引きの場 購入者 ブロックチェイン上のNFTの仕組み 生産者 メタバース 購入者 ブロックチェイン上のNFTの仕組み メタバースとNFT

Slide 313

Slide 313 text

メタバース ブロックチェイン上の NFTの仕組み 生産者 購入者 デジタルコンテンツ NFT (トークン) リンク このパッケージを NFTと呼ぶこともある 購入 メタバースとNFT

Slide 314

Slide 314 text

今後、最大のトレンドの一つ メタバース x ジェネレーティブAI How Generative AI is Powering the Future of Creation on Roblox Bloxy News https://www.youtube.com/watch?v=zISxm50eOG8

Slide 315

Slide 315 text

人間 ジャンルごとの目安 AI 人間 AI 人間 AI 人間 AI 人間 2D画像 3Dモデル 90% 50% 音楽 45% アニメーション 30% AI 音声 80% AI 人間 言語 70%

Slide 316

Slide 316 text

空間型AIの作成

Slide 317

Slide 317 text

スマート環境アクター スマートオブジェクト エージェント スマートポイント スマートスペース エージェント エージェント 制御 制御 制御 ドア ドアノブ スペース オブジェクト(物) ポイント(座標)

Slide 318

Slide 318 text

エージェント 主体 客体 エージェント 主体 客体 転換 環境アクター スマート 環境アクター 主客転換制御

Slide 319

Slide 319 text

メタAI エージェント エージェント自律制御 スマート環境アクター制御 スマート環境アクター制御 スマートスペース スマートオブジェクト スマートポイント コミュニケーション コミュニケーション

Slide 320

Slide 320 text

メタAI エージェント エージェント自律制御 スマート環境アクター制御 スマート環境アクター制御 スマートスペース スマートオブジェクト スマートポイント コミュニケーション コミュニケーション コモングラウンド

Slide 321

Slide 321 text

(メッシュ) コスト : 0.5 見通し: 1.0 地表: 床 推奨高度:5m (メッシュ) コスト : 0.5 見通し: 1.0 地表: 床 推奨高度:10m (メッシュ) コスト : 2.5 見通し: 1.0 地表: 土 推奨高度:10m 壁面:ガラス 壁との衝突は 必ず回避してください エージェント ナビゲーション・メッシュ (メッシュ) コスト : 0.5 見通し: 1.0 地表: 床 推奨高度:7m エレベーターの入り口: 使用する場合は、 メッセージ001を送ってください 空間記述表現

Slide 322

Slide 322 text

同期 スマートシティ (物理世界) スパーシャルAI (空間AI) メタバース (デジタル世界) デジタルツイン空間 同期 スマートスペース

Slide 323

Slide 323 text

空間型AIの制御に入る車 メタAI エージェント エージェント自律制御 スマート環境アクター制御 スマート環境アクター制御 スマートスペース スマートオブジェクト スマートポイント コミュニケーション コミュニケーション

Slide 324

Slide 324 text

(まとめ)ゲームと人工知能の関係 ゲームAI ゲームを外側から プレイするAI ゲーム内側から 構成するAI 将棋、チェス、囲碁… アカデミックで研究されるAI アカデミックではゲームを製作する、 ということはなかなかできない・しない マリオ、ゼルダ、フォートナイト 産業で開発されるAI ゲームを構成するAI ゲームを作り出す 人工知能 ゲームを管理する人工知能 ゲームを製作する人工知能

Slide 325

Slide 325 text

ゲーム、メタバース、 スマートシティ、人工知能

Slide 326

Slide 326 text

ゲーム、メタバース、 スマートシティは 人工知能によって融合する

Slide 327

Slide 327 text

ゲーム メタバース スマート シティ 人工知能

Slide 328

Slide 328 text

オンラインゲーム メタバース 物理空間 世界観 強固、かつ詳細 なるべく緩い設定 現実のまま 物語 大きな物語を準備 物語に沿って イベントが展開 特になし ユーザーが作り出す 現実の経済、人間関係 (ソーシャル)、社会、 など無限の要素 キャラクター (人)の役割 世界、物語の中で 最初から定義 特になし ユーザー の関係の中で発生 不明(実存) オンラインゲーム 物理空間 純粋なメタバース (空っぽの空間)

Slide 329

Slide 329 text

現実世界 デジタル ツイン ミラーワールド スマートシティ メタAI 都市 メタバース (世界モデルと して機能する) 同期 現実を認識する 現実を予測する

Slide 330

Slide 330 text

垂直構造(現実との関連性) 水平構造(世界のスケールの広がり) メタバース 現実世界 デジタル世界 スマート シティ ミラーリングによる同期

Slide 331

Slide 331 text

現実世界 (1) お金の動き (2) 物の動き (3) 人・動物の動き (4) 自然の動き デジタル ツイン (現実世界 そっくりの メタバース) 同期 引き写し ミラーワールド スマートシティ センシングと情報取り込 みによる(1)-(4)の同期 ロボット・AI・情報提示に よるサービス・干渉

Slide 332

Slide 332 text

広場 森 都市 大学 道路 同期 同期 同期 同期 同期 現実と同期するメタバース

Slide 333

Slide 333 text

奈良の鹿ミラーワールド 同期 (ミラー) 現実 メタバース 本物の鹿 デジタルツイン鹿 現実とメタバースをつなぐ

Slide 334

Slide 334 text

物理空間 シミュレーション空間 物理=シミュレーション 混合空間

Slide 335

Slide 335 text

現実世界 現実世界 センサー エフェクタ デジタル ツイン 意思決定・ シミュレーション ゲームエンジン 都市のエージェントの エージェント・ アーキテクチャ 情報経路

Slide 336

Slide 336 text

現実世界 現実世界 センサー エフェクタ デジタル ツイン × 世界モデル (ディープ ラーニング) 都市の 世界モデルの獲得 世界モデル シミュレーション 意思決定 都市の夢を見る シミュレーション エンジン 都市メタAIの エージェント・ アーキテクチャ 情報経路

Slide 337

Slide 337 text

物理世界へ の作用 (指令・行為) 知能 物理世界 情報収集 (知覚) メタバース (集合知性)

Slide 338

Slide 338 text

メタバース 情報の 蓄積 シミュレー ション による予測 人間の叡知 一つの集合知性として機能する 物理空間 への作用 センサー 意思決定 エフェクター 物理空間 からの情報 物理空間へ の作用 集合知性の エージェント・アーキテクチャ

Slide 339

Slide 339 text

さまざまなシミュレーション (クラウド上) 研究者

Slide 340

Slide 340 text

物理世界 物理世界 デジタル世界 物理世界 集合知性 メタバース 物理世界 機械 Level I Level 0 Level III Level II 意識の変容 人とデジタル空間の融合 物理世界

Slide 341

Slide 341 text

活動神経網 知覚神経網 作用 (行為) 内的世界 知能 物理世界 物理世界のリアリティ 反作用 (知覚)

Slide 342

Slide 342 text

活動神経網 知覚神経網 反作用 (知覚) 作用 (行為) 内的世界 知能 シミュレーション世界 シミュレーション世界のリアリティ

Slide 343

Slide 343 text

物理世界へ の作用 (指令・行為) 知能 物理世界 情報収集 (知覚) メタバース (集合知性)

Slide 344

Slide 344 text

シミュレーション

Slide 345

Slide 345 text

ゲームエンジンのUnityにPLATEAUのモデルを入れた画面。 モデルは、品川駅周辺のモデル ~都市全体の外観~ ~道路~ PLATEAUは建物のモデル のみなので、市民が実際 に歩くことになる道路は 自作。 Pythonでの数値シミュ レーション同様、この道 路1つ1つにサービスの水 準を設定し、市民が通る と効用が得られるような 画面を作る。 今後の展望:実際の都市の3Dモデルによるシミュレーション 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱-」 第64回土木計画学研究発表大会、2021年12月

Slide 346

Slide 346 text

仮想空間シミュレーションの動画 シミュレーションを行っている状況を動画で紹介する。 動画内で赤く動いているのが市民である。 市民は品川駅を目指して動き、その過程で効用が計算されるように実装している。 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱-」 第64回土木計画学研究発表大会、2021年12月

Slide 347

Slide 347 text

メタAI型スマートシティの有効性の検証 (Pythonによる数値シミュレーション) メタAIの有効性を検証するために、まずはPythonによる数値シミュレーションを行う。 実験で想定すること 市民は、目的地に着くまでに何本かの道路を歩く。市民は、バリアフリーが充実している道路等、その道 路のもともとの公共サービスの充実度(サービスの水準)に応じて、効用を得る。さらに、各道路には一体 ずつAIエージェントが配置され、AIエージェントは市民から一人を選んで公共サービスを行う。選ばれた市 民は、その道路から得られる効用が、さらに増加する。メタAIは、AIエージェントが重複して同じ市民を選 ばないように命令し、公共サービスを広く全体に行き渡らせる。 道路1 道路2 メタAI 左の市民は前の道路で選ばれ たので、候補から外しなさい 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱-」 第64回土木計画学研究発表大会、2021年12月

Slide 348

Slide 348 text

メタAIのスマートシティへの活用 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱 -PLATEAUデータを用いたマルチエージェントシミュレーションの観点から-」 第64回土木計画学研究発表大会、2021年12月

Slide 349

Slide 349 text

メタAI型スマートシティの有効性の検証 横軸はシミュレーションの回数、縦軸は社会全体の効用について、 メタAIがある場合の効用から、ない場合の効用を引いたもの 全ての状況において、 メタAIを導入した方が 社会全体の効用が高く なる メタAIがある場合とない場合の差 各パターン 効用の差 ~留意点~ 検証の目的はメタAIが 上手く機能することの 確認であるため、効用 の差の大きさにはあま り意味はない 石政龍矢 三宅陽一郎「メタAI型スマートシティ形成の提唱-」 第64回土木計画学研究発表大会、2021年12月

Slide 350

Slide 350 text

メタバース

Slide 351

Slide 351 text

メタバースの定義

Slide 352

Slide 352 text

メタバース オンライン ゲーム 現実

Slide 353

Slide 353 text

オンラインゲーム メタバース 物理空間 世界観 強固、かつ詳細 なるべく緩い設定 現実のまま 物語 大きな物語を準備 物語に沿って イベントが展開 特になし ユーザーが作り出す 現実の経済、人間関係 (ソーシャル)、社会、 など無限の要素 キャラクター (人)の役割 世界、物語の中で 最初から定義 特になし ユーザー の関係の中で発生 不明(実存) オンラインゲーム 物理空間 純粋なメタバース (空っぽの空間) オンラインゲームとメタバースの違い

Slide 354

Slide 354 text

検索エンジン SNS メタバース 検索サーバー ユーザー ユーザー タイム ライン デジタル空間 インタラク ション デファクト・メジャーの遷移

Slide 355

Slide 355 text

メタバース SNS 検索エンジン 現実の人間関係 現実の情報 現実の情報 現実の人間関係 現実の世界の状態 現実の情報 現実の深度 仮想空間のリアリティ

Slide 356

Slide 356 text

デジタル世界 現実世界 垂直構造(現実との関連性) 水平構造(世界のスケールの広がり) オンライン ゲーム メタバース デジタル空間の水平構造と垂直構造

Slide 357

Slide 357 text

時代 メタバース世界の多様化 2006 セカンドライフ 2008 meet-me 2018 2006 Roblox 2009 Internet Adventure 2012 The Sandbox 2008 PlayStation Home 2011 2021 Horizon Worlds 2008 ai sp@ce メタバース 創成記 メタバースと ゲーム空間の 融合 セカンド ライフの影響 メタバースと 現実空間・ 経済との融合 2017 フォートナイト 2022 仮想通貨SAND導入(2017年-) 2003 EVE ONLINE 2015 2000 Phantasy Star Online / Phantasy Star Online 2 UGCを軸とした オンラインゲーム アイテム課金モデル 仮想通貨の隆盛

Slide 358

Slide 358 text

メタバースとソーシャル

Slide 359

Slide 359 text

ソー シャル 空間 ゲーム 空間 ソーシャル 空間 メタバース ソーシャル 空間 1990 2010 2000 2020 オンラインゲームにおいて 徐々にソーシャル的要素が 入れられていった。SNSに 対抗する必要があった。 1990年代において ゲームはソロプレイか その場の数人でする ものであった。 ゲーム的要素の少ないソーシャル 空間をメインとするメタバースが 台頭する。しかし、ゲームとは つながっている。 ゲーム的要素がまったくない、 独立したソーシャル空間が成立 する。SNSの延長としての ソーシャル空間。 SN S SNS SNS ソーシャル 空間 SNSの台頭と拡大 ゲーム 空間 ゲーム 空間 SNS+ゲーム空間=メタバース

Slide 360

Slide 360 text

ゲーム空間とソーシャル空間 の関係 関係図 特徴 ゲーム空間をメインとしつつ、 その周辺のソーシャル空間を 配置する ゲーム空間を補完する形、或いは ゲーム空間で満たされない部分を ソーシャル空間においてみたすよ うに設計する。たとえば、ゲーム 空間が戦闘であれば、ソーシャル 空間は音楽・演劇など。 ソーシャル空間をメインとし つつ、その中にゲーム空間が 埋め込まれる。 ソーシャル空間がメインであり、 そこにそれぞれ独立したゲーム空 間が埋め込まれる。多くの場合、 ユーザーが作成したミニゲームが 点在する形となる。 ゲーム空間-ソーシャル空間 一体型 ゲーム空間とソーシャル空間の区 別ではない。あらゆる場所がゲー ム空間であり、ユーザーが望めば、 あらゆる空間で交流が可能である。 ゲーム空間 ソーシャル 空間 ゲーム 空間 ゲーム 空間 ゲーム 空間 ゲーム 空間 ソーシャ ル 空間 Roblox Sandbox フォートナイト あつ森など ソーシャル 空間

Slide 361

Slide 361 text

メタバース=ゲーム空間の解放 オンラインゲーム

Slide 362

Slide 362 text

スマートシティとメタバースの融合、 人間の行動変容

Slide 363

Slide 363 text

レベル キャラクターAI レベルを認識し、 自律的な判断を行い、 身体を動かす. 敵・味方 キャラクタ- プレイヤー 情報獲得 スパーシャルAI 空間全般に関する思考 メタAI, キャラクターAIの為に 空間認識のためのデータを準備 ナビゲーション・データの管理 パス検索 戦術位置解析 オブジェクト認識 メタAI エージェントを動的に配置 レベル状況を監視 エージェントに指示 ゲームの流れを作る Order Ask & Report ゲーム全体をコントロール Support query query 頭脳として機能

Slide 364

Slide 364 text

現実世界 デジタル ツイン (現実世界 そっくりの メタバース) 相互作用 ミラーワールド スマートシティ センシング AIによる干渉

Slide 365

Slide 365 text

現実世界 デジタル ツイン ミラーワールド スマートシティ メタAI 都市 メタバース (世界モデルとし て機能する) 同期 引き写し 現実を認識する 現実を予測する

Slide 366

Slide 366 text

活動神経網 知覚神経網 作用 (行為) 内的世界 知能 物理世界 物理世界のリアリティ 反作用 (知覚)

Slide 367

Slide 367 text

活動神経網 知覚神経網 反作用 (知覚) 作用 (行為) 内的世界 知能 シミュレーション世界 シミュレーション世界のリアリティ

Slide 368

Slide 368 text

人の知的レベル=環境との相互作用による知的行動 人 環境(世界) 知的行動 知的行動の拡大

Slide 369

Slide 369 text

環境(世界) 知的行動 知的行動の拡大 人 他者(自律的存在) 信頼感情の生成 人の知性の拡大

Slide 370

Slide 370 text

スマートシティ エージェント 知的行動 知的行動の拡大 人 メタAI スマートシティによる知的行動の拡大

Slide 371

Slide 371 text

新しい現実 スマートシティ エージェント 知的行動 知的行動の拡大 メタバース 人 メタAI 人の知性の拡大

Slide 372

Slide 372 text

デジタルゲームから現実=仮想融合世界へ これまでの研究: デジタルゲームの人工知能の 汎用的フレームの構築 これからの研究:都市のための人工知能の 汎用的フレームの構築

Slide 373

Slide 373 text

これまでの研究: デジタルゲームの人工知能の 汎用的フレームの構築 これからの研究:都市のための人工知能の 汎用的フレームの構築 人工知能が人間 を理解すること 人工知能が社会 を理解すること デジタルゲームから現実=仮想融合世界へ