立体四目で学ぶゲームAI

Slide 1

Slide 1 text

立体4目で学ぶゲームAI 辻野貴大

Slide 2

Slide 2 text

自己紹介辻野貴大 Takahiro Tsujino 東京大学工学部精密工学科(リンク) に現在在学中北海道出身、好きな食べ物はジンギスカン日食なつこさんに最近ハマっている

Slide 3

Slide 3 text

目次・立体四目とは？・開発について・AIのアルゴリズム・結果

Slide 4

Slide 4 text

立体四目並べとは ●概要: 平面で行う「五目並べ」を、四目の立体にした対戦型のゲーム ●ルール: 交互に石を置いていき, 自分の色の石をたて、横、斜めに四つ並べたら勝利 ●特徴: 立体的に視点を広がるため, 空間把握能力が必要とされる. 戦略の立て方もかなり大事平和工業(Heiwa Kougyou) 立体4目並べ本体サイズ:10×10×8.5 : ビューティー

Slide 5

Slide 5 text

ゲームの分類完全情報ゲーム選択においてゲームの情報が全て明らかになっている不完全情報ゲーム選択においてゲームの情報が全て明らかになっていない情報性の違い利益性の違いゼロサムゲーム自分の利益が相手の不利益に直結非ゼロサムゲーム自分の利益が相手の不利益と関係ない(協力可能) 確定不確定(運ゲー) 確定不確定確定不確定確定不確定オセロ立体四目麻雀立体四目は「二人零和有限確定完全情報ゲーム」ポーカー人狼 ●特徴: すごろくバックギャモン遊戯王交渉ゲーム人生(？！) ? ? ・相手の最善手を前提としたアルゴリズムを採用可能・ゲーム木が構築可能

Slide 6

Slide 6 text

目次・立体四目とは？・開発について・AIのアルゴリズム・結果

Slide 7

Slide 7 text

技術仕様 ①ユーザー ②ゲームサーバ ③AIサーバ ●仕様・ゲームの状態(盤面、勝敗)を管理・盤面から勝敗を判定 ●仕様・ゲームの状態を描画・石を置く場所を指定する ●仕様・盤面から最適な石の置き場所を決定以下３つから構成される

Slide 8

Slide 8 text

ゲームの流れ ①ユーザー ②ゲームサーバ ③AIサーバ 2. おいた場所を送信 4. 盤面情報を送信 1. UI画面にて置く場所を決定 3,7 . 盤面情報を更新、勝敗がついているか判定 5. 送られてきた盤面情報を元に最適解を算出 6. おいた場所を送信 8. 盤面情報をもとに画面を更新 Websocket API

Slide 9

Slide 9 text

ユーザー画面の構築カメラの移動ボタン選択カーソル: 石を置く場所を決定 ●技術スタック・Vue.js: 言わずもがな・Three.js: 3D空間にて盤面を表示する・Vuetify: レスポンシブ対応などが便利・axios: サーバーとwebsocket通信 ●仕様ゲーム実行中の画面(白はAI,黒はプレイヤー) AIの石立ち上げと同時にゲームサーバとwebsocket 接続. 石を置く際に置いた場所についての jsonを送信

Slide 10

Slide 10 text

目次・立体四目とは？・開発について・AIのアルゴリズム・結果

Slide 11

Slide 11 text

盤面の評価値 ●概要: AIが現在どれほど優勢かを以下のルールに基づいて盤面から算出 ●ルール: ①自分の石(白色)が4つ揃っていれば(勝敗)+1000点, 相手なら-1000点 ②自分の石(白色)が3つ揃っていれば(リーチ)+100点, 相手なら-100点 ●例: ①白石(AI)が4つ揃っている → +1000点 ②黒石(プレイヤー)が3つ揃っている → -100点 Total: 900点 AIの”有利さ”は900点として評価

Slide 12

Slide 12 text

ゲーム木探索・・・次のターン AIが配置可能場所について 16通り存在例: 現在の盤面評価値 -100 評価値 -300 評価値 +200 評価値 +100 次の次のターンプレイヤーが配置可能場所 16通り存在評価値 -300 評価値 +100 評価値 +200 評価値 +100 ・・・現在のターンプレイヤーが石を置いた

Slide 13

Slide 13 text

mini-Max法・・・次のターン AIが配置可能場所について 16通り存在例: 現在の盤面評価値 -100 評価値 -300 評価値 +200 評価値 +100 次の次のターンプレイヤーが配置可能場所 16通り存在評価値 -300 評価値 +100 評価値 +200 評価値 +100 ・・・プレイヤーのターン相手は最善手を打って評価値が最小になる手を打ってくることを想定最小となるものが選択現在のターンプレイヤーが石を置いた

Slide 14

Slide 14 text

mini-Max法・・・次のターン AIが配置可能場所について 16通り存在例: 現在の盤面評価値 -100 評価値 -300 評価値 +200 評価値 +100 次の次のターンプレイヤーが配置可能場所 16通り存在 → 最善手を選んでくることを考える評価値 -300 現在のターンプレイヤーが石を置いた評価値 +400 最小値を選択評価値 -400 評価値 +100

Slide 15

Slide 15 text

mini-Max法・・・次のターン AIが配置可能場所について 16通り存在例: 現在の盤面評価値 -100 評価値 -300 評価値 +200 評価値 +100 次の次のターンプレイヤーが配置可能場所 16通り存在 → 最善手を選んでくることを考える現在のターンプレイヤーが石を置いた評価値 +400 最小値の中で最大相手が最善の手を取ったとしても被害が最小「Mini-Max法」に従ってAIを構築ここを選ぶ

Slide 16

Slide 16 text

目次・立体四目とは？・開発について・AIのアルゴリズム・結果

Slide 17

Slide 17 text

結果白熱した戦いののちAIの勝利・・シンギュラリティが発生

Slide 18

Slide 18 text

結果白熱した戦いののちAIの勝利・・ 2手先読みのためリーチした場合必ず阻止してくるダブルリーチで詰ませるしか勝ち目がない

Slide 19

Slide 19 text

今後の検証・さらに深くゲーム木を探索する(α-β法)の実装でAI同士を対戦、精度評価・立体四目の勝利パターンの発見