Upgrade to Pro — share decks privately, control downloads, hide ads and more …

応用から学ぶ強化学習

 応用から学ぶ強化学習

More Decks by NearMeの技術発表資料です

Other Decks in Technology

Transcript

  1. 15 家のエネルギーマネジメント 状態S • 電気料金 • 太陽光パネルの発電量 行動A • エアコン

    強さ(1, … P) • EV 充電量(1, …P) • 洗濯機 使うか使わないか(0/1) 報酬R • (家庭の電気料金) + (不便さ) 6-9時 9-12時 … 電気料金 (円/kWh) 50円 300円 発電量 (kWh) 80W 200W
  2. 27 参考文献 Dmitry Kalashnikov, Alex Irpan, Peter Pastor, Julian Ibarz,

    Alexander Herzog, Eric Jang, Deirdre Quillen, Ethan Holly, Mrinal Kalakrishnan, Vincent Vanhoucke, et al. Qt-opt: Scalable deep rein-forcement learning for vision-based robotic manipulation. arXiv preprint arXiv:1806.10293, 2018. Barret Zoph and Quoc Le. Neural architecture search with reinforcement learning. In International Conference on Learning Representations, 2017. B Ravi Kiran, Ibrahim Sobh, Victor Talpaert, Patrick Mannion, Ahmad A Al Sallab, Senthil Yo-gamani, and Patrick P´erez. Deep reinforcement learning for autonomous driving: A survey. IEEE Transactions on Intelligent Transportation Systems, 23(6):4909–4926, 2021. Xu Xu, Youwei Jia, Yan Xu, Zhao Xu, Songjian Chai, and Chun Sing Lai. A multi-agent rein-forcement learning-based data-driven method for home energy management. IEEE Transactions on Smart Grid, 11(4):3201–3211, 2020. https://rail.eecs.berkeley.edu/deeprlcourse/static/slides/lec-1.pdf Sutton, R. S., & Barto, A. G. Reinforcement Learning, second edition: An Introduction (2018) Bradford Books. (菊池 悠太, 鮫島 和行, 陣内 佑, 高橋 将文, 谷口 尚平, 藤田 康博, 前田 新一, 松嶋 達也, 奥村 エルネスト純, 鈴木 雅大, 松尾 豊, 三上 貞芳, 山川 宏 今井 翔太, 川尻 亮真 (訳). (2020). 強化学習 第2版 森 北出版) 斎藤康毅 (2022). ゼロから作るDeep Learning➍ オライリージャパン