Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
定期進捗報告#1 強化学習とモビリティ(仮)
Search
Kento Ohgi
June 22, 2019
Technology
1
350
定期進捗報告#1 強化学習とモビリティ(仮)
定期進捗報告会 一回目
藤原研、俺達で良くしていこうな
Kento Ohgi
June 22, 2019
Tweet
Share
More Decks by Kento Ohgi
See All by Kento Ohgi
明日からできるファシリテーション入門
2357gi
0
69
Other Decks in Technology
See All in Technology
一生覚えておきたい「システム開発=コミュニケーション」〜初めての実務案件振り返りLT〜
maimyyym
2
320
競技としてのKaggle、役に立つKaggle
yu4u
6
2.3k
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
5
37k
障害対応をちょっとずつよくしていくための 演習の作りかた
heleeen
1
1.7k
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
2.1k
生成AIの変革の時代に、直近1年で直面した課題とその解決策
ktc_wada
0
630
.NET Profiler in 2024.
kkamegawa
2
1.4k
MapLibreとAmazon Location Service
dayjournal
1
190
ワールドカフェI /チューターを改良する / World Café I and Improving the Tutors
ks91
PRO
0
150
AWSに詳しくない人でも始められるコスト最適化ガイド
yuhta28
2
390
JAWS-UG Bedrock Claude Night
yamahiro
3
710
Babylon.jsと色々なものを組み合わせる:ブラウザのAPIやガジェットや2D描画ライブラリなど / Babylon.js 勉強会 vol.3
you
PRO
0
160
Featured
See All Featured
Designing with Data
zakiwarfel
96
4.8k
Why Our Code Smells
bkeepers
PRO
331
56k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
104
6.6k
A better future with KSS
kneath
231
16k
Making Projects Easy
brettharned
109
5.5k
WebSockets: Embracing the real-time Web
robhawkes
59
7k
Building Effective Engineering Teams - LeadDev
addyosmani
31
1.9k
Designing on Purpose - Digital PM Summit 2013
jponch
111
6.5k
Become a Pro
speakerdeck
PRO
13
4.6k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
226
51k
Design by the Numbers
sachag
274
18k
RailsConf 2023
tenderlove
8
550
Transcript
研究テーマ: 強化学習とモビリティ(仮) 16A5023 大木建人
目次 ・研究背景 ・研究目的 - 目的 - 内容 - 方法 ・現在の進捗状況
・今後の予定
目次 ・研究背景 ・研究目的 - 目的 - 内容 - 方法 ・現在の進捗状況
・今後の予定
都市部を走る車の 乗車時間における渋滞時間の割合 研究背景 国土交通省による平成 24 年度プローブデータを用いた試算より 約4割が渋滞時間! スムーズに流れている 時間
目次 ・研究背景 ・研究目的 - 目的 - 内容 - 方法 ・現在の進捗状況
・今後の予定
研究目的 強化学習を使い 渋滞を改善する!
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 道路を拡張する 信号機の アルゴリズムを 改善 渋滞を改善する様々なアプローチ 車両自体を
制御
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 道路を拡張する 信号機の アルゴリズムを 改善 渋滞を改善する様々なアプローチ 総合的な
コスト高し 車両自体を 制御
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 道路を拡張する 信号機の アルゴリズムを 改善 渋滞を改善する様々なアプローチ 総合的な
コスト高し 車両自体を 制御 使える!
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御 教師とする正解がない
最適解を環境から 考え出さなければ ならない
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御 教師とする正解がない
最適解を環境から 考え出さなければ ならない 環境から答えを見つけ出すことができる 強化学習が最適!
目次 ・研究背景 ・研究目的 - 目的 - 内容 - 方法 ・現在の進捗状況
・今後の予定
無し!
現在の状況 つい最近 このテーマでやりたいと自分の中で整理がついた 強化学習は勉強してるのでなんとなくイメージがついてる 長期的な研究計画を立ててる
長期的な研究計画を立てている :now trelloにて計画とやること、やらなければいけないことを立てている。 来週半ばまでに計画を立て終わり、計画に乗っ取り実行していく。 Trelloのカラムに”諦める”を追加するつもり。 Trelloはオープンしています。 よろしくおねがいします。
現在の状況 先行研究を探し、 どのような強化学習手法を使い渋滞を改善しているか を纏めている DQN アンサンブルGA Double - DQN 仮想方向指示機
今後の予定(直近) どの手法を用いて どのようなアプローチで改善をするのかを 考える。 DQN アンサンブルGA Double - DQN 仮想方向指示機
今後の予定(中期) シュミレーター アルゴリズム 実装 DQN アンサンブルGA Double - DQN 仮想方向指示機
今後の予定(長期) 論文書く DQN アンサンブルGA Double - DQN 仮想方向指示機 頑張りましょう。終
研究目的 強化学習を使い渋滞を改善する! 強化学習を 選択する理由 信号機の アルゴリズムを 改善 車両自体を 制御 教師とする正解がない
最適解を環境から 考え出さなければ ならない 環境から答えを見つけ出すことができる 強化学習が最適!
環境から答えを 見つけ出すことができる 強化学習が最適なワケ 機械学習 パー グー チョキ 教師data じゃあ これに勝てるのは?
??? 補足スライド
環境から答えを 見つけ出すことができる 強化学習が最適なワケ 機械学習 パー グー チョキ 教師data じゃあ これに勝てるのは?
パー 機械学習は 答えが明確な問題を 解くのが 得意。 補足スライド パー
環境から答えを 見つけ出すことができる 強化学習が最適なワケ 問題 補足スライド 3回ジャンケンして 一番配点の高い勝ち方を 考えろ! ただし、グーのときは 負けると3点貰える!
1回戦 2回戦 3回戦 チョキ: 1点 グー: 0点 パー: 0点 チョキ: 0点 グー: 1点 パー: 0点 チョキ: 3点 グー: 1点 パー: 0点 配点
環境から答えを 見つけ出すことができる 強化学習が最適なワケ 問題 補足スライド 3回ジャンケンして 一番配点の高い勝ち方を 考えろ! ただし、グーのときは 負けると3点貰える!
1回戦 2回戦 3回戦 チョキ: 1点 グー: 0点 パー: 0点 チョキ: 0点 グー: 1点 パー: 0点 チョキ: 3点 グー: 1点 パー: 0点 配点 これが環境