BLUE PROTOCOLのゲームAIフィロソフィー

BLUE PROTOCOLのゲームAIフィロソフィー株式会社バンダイナムコスタジオ長谷洋平

自己紹介 • 2009年、株式会社バンダイナムコゲームス（当時）入社 • エースコンバットシリーズ、鉄拳シリーズなどの開発に携わる • 現在はBLUE PROTOCOLのリードAIプログラマとして全体設計、コア実装、マネジメントなどを担当 •
開発と並行し、最新の人工知能技術のリサーチも行う • 2015年～2020年のCEDECで計10件の登壇

この講演について • BLUE PROTOCOLで使用しているAIシステムがどのような思想で設計・実装されているかを紹介します • システム面にフォーカスしているのでゲーム内容に関する話は少なくなっています • BLUE
PROTOCOLに特化した内容ではないので幅広いゲームで参考にしていただけると思います • 時間の関係で技術の細部まで紹介できないところは最後に紹介する過去の講演資料をご覧ください

アジェンダ 1. イントロダクション • ゲームの紹介、設計方針 2. テクノロジー • 空間認識、意思決定、キャラクター制御 3.
まとめ

 オンラインアクションRPG  操作できる劇場アニメ  パーティ vs パーティのバトル 
2020年4月クローズドβテスト実施

AIキャラクターエネミー味方NPC モブNPC

コンテンツフィールド闘技場ダンジョンレイド

設計方針課題 • 新規IPのため仕様がコロコロ変わる • 運営型のオンラインゲームのため将来にわたっていろいろなコンテンツが追加されるデータドリブンモジュール性

データドリブンコードベースの判定をなくしデータにより定義されるようにする開発フェーズや人員のスキルに応じて適宜振り分けるビヘイビアツリーであっても一定以上の複雑さを超えると企画だけで１からAIの振る舞いを構築するのは困難 ≠ 企画にすべて任せる仕様変更や追加に迅速に対応できる、イテレーションの高速化 →
• エンジニア • AIデザイナ • オートメーション例：if (ゴブリンだったら) …, if (ダンジョンだったら) … はダメ！

モジュール性責任範囲を明確にし、その責任範囲内でシンプルかつ再利用性の高い部品を作る 2種類のモジュール • コアとなる技術レベルでのモジュール • データレベルでのモジュール部品を様々に組み合わせることで多くの仕様を可能な限り安く実現する
→

ゲームAIエンジン描画や物理などのほかの要素技術と違い、ゲームの上に実装されているAIを汎用なエンジンとしてプラグイン化コアフレームワークゲーム AI ゲームAIエンジンゲームエンジン

キャラクターとAIの切り分け街中のモブNPCを含む全AIキャラクターが操作可能（開発用）

まとめ

アーキテクチャ空間認識意思決定制御環境身体記憶

空間認識センサーシステム（プッシュ型） • 環境からイベントを受け取り、それに反応する形で対象を認識する Perception Tree（プル型） • 自らが能動的に環境を調べて情報を取得する Influence Map（データストア）
• 環境中に情報を格納して状況の分析を行う

センサーシステム生物 • 視覚 • 聴覚 • 痛覚 • etc...
ゲーム要件 • ボリューム • etc...

Perception Tree • 環境を評価するクエリーシステム • Behavior Tree の実装を流用して作成している • Behavior
Tree のエディタをそのまま使用 • 設定ファイルで、ノードのみ Perception Tree 用のものに変更

Perception Tree ポイントだけでなくアクターも対象にできるのでエネミーのターゲット評価も Perception Tree で実現しているポイントを生成生成したポイントを評価（フィルタリング、スコアリング）
一番スコアが高いポイントを選択

Perception Tree クエリーの分岐 • 自分や周りの状況をもとにクエリーの一部を変える • クエリーが失敗したときに別のクエリーを試す Behavior Tree を流用する利点
①

Perception Tree 多段階クエリー • 最初に実行したクエリーの結果を後続のクエリーで使う Behavior Tree を流用する利点 ② ①
②

Perception Tree 複数フレームへの処理の分散（タイムスライス） • 各ノードは実行時に実際に行った処理量に応じてコストを返す • 1フレームでの実行できるコストの閾値を超えるとそのフレームでの処理は中断して残りを次に持ち越す Behavior Tree
を流用する利点 ③ Cost 5 Cost 20 Cost 1 フレーム1 フレーム2

Perception Tree パラメーターを外に出す • パラメーター付きBTの機能を活用（Parameterized Behavior Tree） Behavior Tree を流用する利点
④ BTエディタ UE4

Perception Tree パラメーターを外に出す • 渡されたパラメータはBTのローカルのBlackboardに入る Behavior Tree を流用する利点 ④ ローカルBB
パラメーターノードのプロパティへマッピング

Perception Tree パラメーターを外に出す • 同じクエリーに違うパラメーターを渡して近接職、遠距離職のレンジの違いを実現 Behavior Tree を流用する利点 ④

Influence Map グラフ構造のデータ上に値を格納・伝搬させることで環境に関する情報を計算、共有するための手法 Perception Tree はクエリーを発行するたびに計算が走るが、 Influence Map
はデータを保持しているので大局的な分析や継続的な分析に向いている Perception Tree のクエリーから Influence Map を参照することも可能

Influence Map レイアウト：グラフ構造構成ソーシャルグラフグリッドナビメッシュレイヤー：値を格納しておく箱ざっくり言うと… 任意のデータ型の配列（例：float[]）

Influence Map レイアウト

Influence Map レイアウトナビメッシュの情報をもとにセルのリンク情報を生成（セル同士のつながり）マップの構造を考慮した値の伝搬が可能に

Influence Map • レイアウトのグラフ構造を探索してインデックスを取得 • 同じインデックスを使用してセル情報（位置やリンク情報）とそのレイアウトから作ったレイヤーの値にアクセスできる問い合わせレイアウトレイヤーA
座標インデックスレイヤーB レイヤーC

Influence Map • 複数のレイヤーや計算式を組み合わせることで基本となるレイヤーを使いまわして様々な目的の情報を得る • 同じインデックスでアクセスできるので、最低限のオーバーヘッドで単一レイヤーと同じように情報を取得できる • 新規レイヤーは追加されないのでメモリの負荷もほとんどない
複合レイヤーコードでの定義例 auto CompLayer = IM_Mul( IM_Add(IM_Layer("FriendLayer"), IM_Inv(IM_Layer("EnemyLayer"))), IM_Op([&](auto& Pos) { return Clamp(1 - Distance(Pos, MyPos) / 1000, 0, 1); }) );

Influence Map 大局分析前線

Influence Map プレイヤーがよく通る場所はどこか？統計分析

Influence Map モブNPCのスポーニングモブNPCが歩ける場所、たむろしている場所には密度が設定されているクライアントのマシンスペックや処理負荷に応じて街の密度感を維持したままモブNPCの数のコントロールを
できるようにするため

Influence Map モブNPCのスポーニング密度マップ×負荷やスペックに応じたスケール設定された密度を満たすように生成する

意思決定エネミー・味方NPC 空間認識意思決定制御環境身体熟考反射行動

意思決定エネミー・味方NPC 空間認識意思決定制御環境身体熟考反射行動何をする？
どうする？行動に移す

何をする？ Utility System 注視戦闘徘徊現在の状況からそれぞれの行動をどれだけしたいか（欲求度）を計算し、一番高い行動を選ぶ二番目の行動も並行してできそうであれば並行して行う

どうする？ Preference-based HTN Planning Utility System で決まった欲求を満たすためにどういった行動をすればいいかを計画するキャラクターごとに行える行動は違うので計画した結果も別になる

行動に移す Behavior Tree Behavior Tree に書かれた行動手順通りにキャラクターを制御する

BDIモデル「意図の理論」をベースとしたエージェントアーキテクチャアルゴリズム 1. 信念と欲求から達成すべき目標（願望）を決め、達成手段の候補を求める 2. 達成手段の候補から実際に行う手段を熟考して決定 3. 決定した手段を意図として実行する
4. 外部からの知覚をもとに信念を更新する何をする？どうする？行動に移す

ちなみに... 何をする？どうする？命令を与える何をする？どうする？行動に移す複雑な行動は行わないので直接行動の実行につなぐコーディネーター（集団制御用AI）モブNPC
Utility System Preference-based HTN Planning Behavior Tree 命令の付与に代わっているがアーキテクチャは一緒 Behavior Tree Utility System

データをどう作るか？何をする？どうする？行動に移す同じコンテンツならどのエネミーもほとんど共通エネミーごとに行えることは違う

Preference-based HTN Planning HTN Planning • 行動による状態の変化を考慮した一連の行動を事前に計画するプランニング技術の一種 • 抽象的なタスクをより具体的なタスクへ
分割していくことで必要な行動とその順序を見つける Preference-based Planning • 個人の嗜好に基づいた計画を立てる技術 • 好みを後から指定して計画を評価することができる HTN Planning + Preference-based Planning

HTN Planning 起きる朝食着替える家を出る準備食べるご飯を炊くパンを焼く
朝支度ドメイン

朝支度ステートパン：1枚現在の状態とプリコンディションを比較して分割していいかを判定するパンがあるお米がある ✓ ✕

朝支度ステートパン：0枚パン -1枚これ以上分割できないタスクにはタスクを実行することで状態がどう変わるかが設定されている

HTN Planning 目を覚ますパンを焼く朝支度 … キッチンに行く目覚ましを止める …
これ以上分割ができないところまで分割をし終えるとプランニング終了タスクを順番に実行していく

HTN Planning エディタ複合タスクプリミティブタスク事前条件事後条件アクション

プリファレンス • ドメインの外からプランに課す制約 • 満たされたプリファレンスの数でプランを評価する • 同じドメイン（思考ルーチン）を再利用しつつ好みに応じた違うプランを作り出せる制約の強さ •
ソフト制約：可能な限り満たしてほしい条件 • ハード制約：必ず満たすべき条件

プリファレンスプリコンディションプリファレンスタスクやメソッドの実行前の状態に対する制約朝食準備ご飯を炊くパンを焼くプリファレンス：お米 (パン) の所持数が多いステート
お米：10合、パン：1枚ご飯を炊くステートお米：1合、パン：10枚パンを焼く

プリファレンスゴールプリファレンスプランが見つかった時の最終状態に対する制約プリファレンス：洗い物の数が少ない +4 (お茶碗、お箸、内釜、しゃもじ) ご飯を炊くパンを焼く食べる食べる
+1 (お皿)

プリファレンストラジェクトリープリファレンスプラン全体を通した条件の時間的変化に対する制約例：常にAが満たされる、Aが満たされた後Bを満たすなど起きる朝食着替える家を出るプリファレンス：SometimeAfter(着替える,
朝食) 着替える朝食評価朝食着替える評価

タクティカルスキル • サブドメイン（＋パラメータ）とプリファレンスのセット • 攻撃、移動、待機などのあらゆる行動がスキルとして実装される • 全スキルのサブドメインを組み合わせてドメインが作られるドメイン

タクティカルスキル例：攻撃アクションサブドメインのテンプレートドメインへ渡すパラメータ攻撃の種類ごとに動きの詳細を記述したテンプレートを使いまわすその攻撃をどういう状況で
使ってほしいかをプリファレンスで定義

タクティカルスキルガードスキルありガードスキルなし

キャラクター制御 • コード駆動ではなくアニメーション駆動 • 多くのアクションは一つのフルボディアニメーションメリット • 機械的でない、より自然な動きを実現できる • より少ない制約で自由にアニメーションを作れる
• 通信による位置の補間を抑制できる

キャラクター制御アニメーション駆動なので調整するのはもっぱらアニメーションイテレーション

キャラクター制御課題 • コード駆動であればプログラム上で使うパラメーターなどで自分の身体能力がわかるが、アニメーション駆動だと自分自身の能力がわからない • 例：いつ武器を振れば当たるのかわからない • AIが正しくキャラクターを動かせるようにするためには
アニメーションにあったパラメータを設定しないといけないが、設定をミスると不具合の原因になる面倒な作業自動でデータを集めたい

アニメーションサンプリング事前にモーションをいろいろ出してみて各種データを収集する収集データ • 再生時間 • 移動量 • メタデータ（攻撃範囲、時間、etc...）

アニメーションサンプリング使用例回避アクションの移動量と時間からプレイヤーの攻撃を回避できるか判定攻撃のヒット範囲とヒットするまでの時間から攻撃アクションをトリガーするタイミングを判定

アニメーションサンプリングサンプリングデータに特定のアニメーションのデータが含まれるかを見れば、キャラクターが行えるアクションがわかる多くのキャラクターが共通して持つスキルについて個々に設定せずにアクションの有無から自動で設定使用例サンプリングデータを見て自動でスキルの有効・無効を切り替えられる＝

アニメーションワーピング • アニメーション駆動であっても単純に再生するだけだとプレイヤーが狭いスポットに入らないと攻撃を当てられない • かといってアニメーションをいくつも作ってブレンドするのはコストが高い
アニメーションの軌跡をプログラムで調整する

アニメーションワーピング • 位置や向きの差分を毎フレーム少しずつ詰めていく • 不自然になる場合は再生スピードも調整サンプリングデータがあるので計算が容易アニメーションワープ期間

アニメーションワーピング目標やワープ期間は複数設定可能

ジャンプ攻撃

ジャンプ攻撃アニメーションワーピングによる補正も含めた攻撃を当てられる範囲ダメージコリジョンが出るまでの時間をもとにプレイヤー位置を予測青：サンプリングデータ

ジャンプ攻撃プレイヤーの予測位置とルートボーンからヒット範囲の中心までのオフセットから補正の目標位置・向きを決定青：サンプリングデータ

キャラクター制御制御 AI 企画アニメーターサンプリング使用調整アニメーションとそれに付随するメタデータを調整するだけでAIは自動で正しく制御する！

まとめ

まとめ最初から Behavior Tree をほかにも流用可能なように設計 → 高機能な空間認識のシステムを安く作成できたスキルの組み合わせによるAIの定義 → 多彩なバリエーションのキャラクターを効率的に量産できる
アニメーションサンプリングによるデータの自動収集 → アニメーションの調整だけできれいに動く

資料 BLUE PROTOCOL 搭載技術の詳細は以下をご参照ください • Perception Tree ～Behavior Treeを応用したお手軽、柔軟な環境認識システム～, CEDEC2017
（https://cedil.cesa.or.jp/cedil_sessions/view/1657） • 空を優雅に飛ぶキャラクターのための3次元パス検索とステアリング, CEDEC2018 （https://cedil.cesa.or.jp/cedil_sessions/view/1833） • BLUE PROTOCOL の個性豊かなキャラクターを動かす意思決定システム, CEDEC2019 （https://cedil.cesa.or.jp/cedil_sessions/view/2102） • BLUE PROTOCOL のパーティバトルを支える集団制御 AI, CEDEC2020 （https://cedil.cesa.or.jp/cedil_sessions/view/2271）

BLUE PROTOCOLのゲームAIフィロソフィー

BLUE PROTOCOLのゲームAIフィロソフィー

More Decks by Bandai Namco Studios Inc.

Other Decks in Technology

Featured

Transcript