Upgrade to Pro — share decks privately, control downloads, hide ads and more …

定期進捗報告#1 強化学習とモビリティ(仮)

定期進捗報告#1 強化学習とモビリティ(仮)

定期進捗報告会 一回目

藤原研、俺達で良くしていこうな

Kento Ohgi

June 22, 2019
Tweet

More Decks by Kento Ohgi

Other Decks in Technology

Transcript

  1. 研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御 教師とする正解がない

    最適解を環境から 考え出さなければ ならない 環境から答えを見つけ出すことができる 強化学習が最適!
  2. 研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御 教師とする正解がない

    最適解を環境から 考え出さなければ ならない 環境から答えを見つけ出すことができる 強化学習が最適!
  3. 環境から答えを 見つけ出すことができる 強化学習が最適なワケ 問題 補足スライド 3回ジャンケンして 一番配点の高い勝ち方を 考えろ! ただし、グーのときは 負けると3点貰える!

    1回戦 2回戦 3回戦 チョキ: 1点 グー: 0点 パー: 0点 チョキ: 0点 グー: 1点 パー: 0点 チョキ: 3点 グー: 1点 パー: 0点 配点
  4. 環境から答えを 見つけ出すことができる 強化学習が最適なワケ 問題 補足スライド 3回ジャンケンして 一番配点の高い勝ち方を 考えろ! ただし、グーのときは 負けると3点貰える!

    1回戦 2回戦 3回戦 チョキ: 1点 グー: 0点 パー: 0点 チョキ: 0点 グー: 1点 パー: 0点 チョキ: 3点 グー: 1点 パー: 0点 配点 これが環境