Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ぼくのかんがえたさいきょうのマリオAI

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

 ぼくのかんがえたさいきょうのマリオAI

Avatar for Ushitora Anqou

Ushitora Anqou

December 10, 2018
Tweet

More Decks by Ushitora Anqou

Other Decks in Programming

Transcript

  1. いろんなやりかた • ルールベース • すたっとさんとか • つらそう • 遺伝的アルゴリズム •

    VT-b とか • つらそう • ヂープラニーング(DQN) • 梅さんとか • つらそう 6
  2. ところで • マリオ AI のステージは固定 • ランダム要素はない。 • エージェント出力の種類は有限 •

    6 個のボタンの ON/OFF なので 26 = 64 ⬇ 出力を全て決めればその評価は一定 9
  3. どゆこと? 事前にエージェントの出力を決める。 1. 右移動+ダッシュ 2. 右移動+ジャンプ 3. ジャンプ . .

    . これを出力した後の状態を評価すると、そ の出力の「よさ」が分かる ➡ 探索可能 10
  4. 続‧すくなく計算する 人間がマリオを遊ぶ。 • 人間の反応時間は 0.2s。 • 片や PC の画面更新は 30fps

    → 0.033s ➡ 人間のほとんどの反応は前と同じ 同様にエージェントの出力をダブらせる。 17
  5. 続‧評価関数をつくる • マリオの x 座標を使う? • 無謀にジャンプして距離を稼ぎ死ぬ。 • 袋小路に入って死ぬ。 •

    マリオの y 座標を使う? • ジャンプし続けて死ぬ。 • その他の指標? • わからん!w 23