ゲーム理論の基礎 (非協力ゲーム)

ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 1

目次戦略型ゲーム戦略型ゲームの定義最適反応とナッシュ均衡混合戦略と混合戦略ナッシュ均衡数値計算ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai,
Twitter: @tcbn_ai 2

1. 戦略型ゲーム 1.1. 戦略型ゲームの定義戦略型ゲーム：複数の意思決定主体間の相互作用を表す数理モデル意思決定主体は自分自身の行動 (純粋戦略) を選択する行動に対して利得が与えられている利得は、自分の行動と他の意思決定主体の行動に依存して決まる
数学的に戦略型ゲームを定義する。ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 3

Def (戦略型ゲーム) 戦略型ゲームは、タプルとして定義される。ただし、 : プレイヤーの集合 (有限集合) :
純粋戦略空間 : プレイヤーの純粋戦略集合 : 利得関数、 : プレイヤーの利得関数ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 4

例：囚人のジレンマ , , は以下の表のように定義。 \ プレイヤーが戦略、プレイヤーが戦略をとったとき
プレイヤーの利得：プレイヤーの利得：ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 5

補足：第要素のみがであるような次元単位ベクトルとする。人ゲームの利得は行列 (利得行列) として表現される。に対して、
, , ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 6

プレイヤー、プレイヤーの利得行列は以下のようになる。囚人のジレンマの例では、となる。ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai,
Twitter: @tcbn_ai 7

1.2 最適反応とナッシュ均衡とする。 Def (最適反応) がに対する純粋最適反応他のプレイヤーの行動を固定したときの最適な行動等価な条件は、 1つとは限らないが、必ず存在する

Def (ナッシュ均衡) が (純粋戦略) ナッシュ均衡自分だけが行動を変更しても得をしない等価な条件は、 1つとは限らず、存在しない場合もあるすべてのプレイヤーにとって合理的実現すればそこから動かない。どのように実現するかは考えな
い。ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 9

例：囚人のジレンマ \ プレイヤーの戦略をに固定したときのプレイヤーの利得プレイヤーがをとる：、プレイヤー
がをとる：プレイヤーの戦略をに固定したときのプレイヤーの利得プレイヤーがをとる：、プレイヤーがをとる：ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 10

プレイヤーの戦略を固定したときも同様。最適反応に対してに対してナッシュ均衡：囚人のジレンマでは、ナッシュ均衡はパレート最適ではない。パレート最適：自分の利得を上げるには他のプレイヤーの利得を悪化させる状態双方のプレイヤーにとって利得が一番良いのは
となること。ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 11

1.3 混合戦略と混合戦略ナッシュ均衡ゲームを考える。上の確率分布をプレイヤーの混合戦略と呼ぶ。は以下のように表される。また、純粋戦略空間に対応する混合戦略空間
は、ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 12

補足は単位ベクトルを頂点とする次元単位単体となる。のとき、混合戦略は、線分 , 上の点である。ゲーム理論の基礎
(非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 13

以下の記号を定義する。：でが実際に起こる確率利得関数の混合戦略への拡張 (期待利得関数) は、以下で定義される。 , ゲーム理論の基礎 (非協力ゲーム)
AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 14

ゲームは、に拡張される。人ゲームとき、利得関数は利得行列を用いて以下のように表現される。ゲーム理論の基礎 (非協力ゲーム) AiTachi,
GitHub:tcbn-ai, Twitter: @tcbn_ai 15

例：囚人のジレンマ混合戦略集合は以下のように定義される。利得関数は以下のように定義される。ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter:
@tcbn_ai 16

Def (最適反応) をに対する純粋戦略最適反応、をに対する混合戦略最適反応と呼ぶ。純粋戦略最適反応対応 : 混合戦略最適反応対応 :

Def (ナッシュ均衡) が成り立つとき、をナッシュ均衡という。ナッシュ均衡すべてのプレイヤーにとって合理的な解有限ゲームでは必ず存在 (複数存在する可能性あり) ゲーム理論の基礎 (非協力ゲーム)
AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 18

例：調整ゲーム \ ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 19

プレイヤーの混合戦略をで固定する。プレイヤーが純粋戦略をとるときの期待利得は、ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter:
@tcbn_ai 20

プレイヤーの混合戦略をで固定する。プレイヤーが純粋戦略をとるときの期待利得は、ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai
21

混合戦略最適反応対応は、と求められる。ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 22

ナッシュ均衡はゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 23

1.4 数値計算 Python の nashpy というパッケージを使うと、2人ゲームの定義、ナッシュ均衡の導出が可能。 python3 -m venv
~/.venvs/game_numerical source ~/.venvs/game_numerical/bin/activate (game_numerical) pip install --upgrade pip (game_numerical) pip install -r requirements.txt requirements.txt には、 numpy , nashpy , jupyter , ipykernel が記述されていれば良い。ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 24

例：じゃんけん A = np.array([[0, 1, -1], [-1, 0, 1], [1,
-1, 0]]) B = np.array([[0, -1, 1], [1, 0, -1], [-1, 1, 0]]) coordination_game = nash.Game(A, B) coordination_game ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 25

Zero sum game with payoff matrices: Row player: [[ 0
1 -1] [-1 0 1] [ 1 -1 0]] Column player: [[ 0 -1 1] [ 1 0 -1] [-1 1 0]] ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 26

equilibria = coordination_game.vertex_enumeration() for eq in equilibria: print(eq) (array([0.33333333, 0.33333333,
0.33333333]), array([0.33333333, 0.33333333, 0.33333333])) ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 27

参考文献 [1] 岡田章, ゲーム理論, 2011. [2] H. Peter, Game Theory:
A Multi-Leveled Approach, Springer, 2015. [3] Nashpy's documentation, accessed on 08/06/2022 ゲーム理論の基礎 (非協力ゲーム) AiTachi, GitHub:tcbn-ai, Twitter: @tcbn_ai 28

ゲーム理論の基礎 (非協力ゲーム)

ゲーム理論の基礎 (非協力ゲーム)

AiTachi

More Decks by AiTachi

Other Decks in Science

Featured

Transcript