強化学習で酔っ払いを学ぼう@canonno_blog
View Slide
自己紹介• 賀野 壮一朗• 某飲料メーカー 入社三年目• ピアノが趣味。作曲もぼちぼち。• ProtoOut 4期生。Tシャツ着てます• ウルトラソウルが大好き
業務でAI/機械学習の実装を担当
「こう来たらこう答えて」教師あり学習「データの癖を教えて」教師なし学習「最終的にこれを目指して」強化学習
「こう来たらこう答えて」教師あり学習「最終的にこれを目指して」強化学習「データの癖を教えて」教師なし学習
=
お酒好きですか???????
出口についたら+1。人にぶつかったら-1。期待値的にどう行くのが一番良い?
berobero = 0.1
berobero = 0.3
IJIDEMOUE NI IKITAI
berobero = 0.5
GYAKUNIYOYUU
berobero = 0.1酔ってないし突っ切ったろ
berobero = 0.1やっぱ壁沿いで無難にいきます
KABEDUTAI NI IKUYOPPARAI NO TENKEI
強化学習もゆるゆる勉強しましょおう