Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
定期進捗報告#1 強化学習とモビリティ(仮)
Search
Kento Ohgi
June 22, 2019
Technology
1
360
定期進捗報告#1 強化学習とモビリティ(仮)
定期進捗報告会 一回目
藤原研、俺達で良くしていこうな
Kento Ohgi
June 22, 2019
Tweet
Share
More Decks by Kento Ohgi
See All by Kento Ohgi
明日からできるファシリテーション入門
2357gi
0
93
Other Decks in Technology
See All in Technology
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
ECS障害を例に学ぶ、インシデント対応に備えたAIエージェントの育て方 / How to develop AI agents for incident response with ECS outage
iselegant
4
430
旅先で iPad + Neovim で iOS 開発・執筆した話
zozotech
PRO
0
100
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
Amazon Bedrock Knowledge Basesチャンキング解説!
aoinoguchi
0
170
今こそ学びたいKubernetesネットワーク ~CNIが繋ぐNWとプラットフォームの「フラッと」な対話
logica0419
5
530
データの整合性を保ちたいだけなんだ
shoheimitani
8
3.2k
AIエージェントに必要なのはデータではなく文脈だった/ai-agent-context-graph-mybest
jonnojun
1
250
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
580
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
520
Kiro IDEのドキュメントを全部読んだので地味だけどちょっと嬉しい機能を紹介する
khmoryz
0
210
Agile Leadership Summit Keynote 2026
m_seki
1
680
Featured
See All Featured
For a Future-Friendly Web
brad_frost
182
10k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
920
First, design no harm
axbom
PRO
2
1.1k
Balancing Empowerment & Direction
lara
5
900
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
140
The agentic SEO stack - context over prompts
schlessera
0
650
The Cost Of JavaScript in 2023
addyosmani
55
9.5k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
77
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.2k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
Transcript
研究テーマ: 強化学習とモビリティ(仮) 16A5023 大木建人
目次 ・研究背景 ・研究目的 - 目的 - 内容 - 方法 ・現在の進捗状況
・今後の予定
目次 ・研究背景 ・研究目的 - 目的 - 内容 - 方法 ・現在の進捗状況
・今後の予定
都市部を走る車の 乗車時間における渋滞時間の割合 研究背景 国土交通省による平成 24 年度プローブデータを用いた試算より 約4割が渋滞時間! スムーズに流れている 時間
目次 ・研究背景 ・研究目的 - 目的 - 内容 - 方法 ・現在の進捗状況
・今後の予定
研究目的 強化学習を使い 渋滞を改善する!
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 道路を拡張する 信号機の アルゴリズムを 改善 渋滞を改善する様々なアプローチ 車両自体を
制御
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 道路を拡張する 信号機の アルゴリズムを 改善 渋滞を改善する様々なアプローチ 総合的な
コスト高し 車両自体を 制御
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 道路を拡張する 信号機の アルゴリズムを 改善 渋滞を改善する様々なアプローチ 総合的な
コスト高し 車両自体を 制御 使える!
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御 教師とする正解がない
最適解を環境から 考え出さなければ ならない
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御 教師とする正解がない
最適解を環境から 考え出さなければ ならない 環境から答えを見つけ出すことができる 強化学習が最適!
目次 ・研究背景 ・研究目的 - 目的 - 内容 - 方法 ・現在の進捗状況
・今後の予定
無し!
現在の状況 つい最近 このテーマでやりたいと自分の中で整理がついた 強化学習は勉強してるのでなんとなくイメージがついてる 長期的な研究計画を立ててる
長期的な研究計画を立てている :now trelloにて計画とやること、やらなければいけないことを立てている。 来週半ばまでに計画を立て終わり、計画に乗っ取り実行していく。 Trelloのカラムに”諦める”を追加するつもり。 Trelloはオープンしています。 よろしくおねがいします。
現在の状況 先行研究を探し、 どのような強化学習手法を使い渋滞を改善しているか を纏めている DQN アンサンブルGA Double - DQN 仮想方向指示機
今後の予定(直近) どの手法を用いて どのようなアプローチで改善をするのかを 考える。 DQN アンサンブルGA Double - DQN 仮想方向指示機
今後の予定(中期) シュミレーター アルゴリズム 実装 DQN アンサンブルGA Double - DQN 仮想方向指示機
今後の予定(長期) 論文書く DQN アンサンブルGA Double - DQN 仮想方向指示機 頑張りましょう。終
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御 教師とする正解がない
最適解を環境から 考え出さなければ ならない 環境から答えを見つけ出すことができる 強化学習が最適!
環境から答えを 見つけ出すことができる 強化学習が最適なワケ 機械学習 パー グー チョキ 教師data じゃあ これに勝てるのは?
??? 補足スライド
環境から答えを 見つけ出すことができる 強化学習が最適なワケ 機械学習 パー グー チョキ 教師data じゃあ これに勝てるのは?
パー 機械学習は 答えが明確な問題を 解くのが 得意。 補足スライド パー
環境から答えを 見つけ出すことができる 強化学習が最適なワケ 問題 補足スライド 3回ジャンケンして 一番配点の高い勝ち方を 考えろ! ただし、グーのときは 負けると3点貰える!
1回戦 2回戦 3回戦 チョキ: 1点 グー: 0点 パー: 0点 チョキ: 0点 グー: 1点 パー: 0点 チョキ: 3点 グー: 1点 パー: 0点 配点
環境から答えを 見つけ出すことができる 強化学習が最適なワケ 問題 補足スライド 3回ジャンケンして 一番配点の高い勝ち方を 考えろ! ただし、グーのときは 負けると3点貰える!
1回戦 2回戦 3回戦 チョキ: 1点 グー: 0点 パー: 0点 チョキ: 0点 グー: 1点 パー: 0点 チョキ: 3点 グー: 1点 パー: 0点 配点 これが環境