Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
yurufuwaLT
Search
canonno
April 08, 2021
Technology
0
140
yurufuwaLT
canonno
April 08, 2021
Tweet
Share
More Decks by canonno
See All by canonno
communeLT
canonno
0
7.3k
enebularLT
canonno
0
250
Try_English_LT.pdf
canonno
1
290
IoT LT
canonno
0
340
Enebular LT
canonno
0
780
Other Decks in Technology
See All in Technology
いろんなものと両立する Kaggleの向き合い方
go5paopao
2
970
利きプロセススケジューラ
sat
PRO
4
2.6k
Exadata Database Service on Cloud@Customer セキュリティ、ネットワーク、および管理について
oracle4engineer
PRO
0
1.1k
AI機能の開発運用のリアルと今後のリアル
akiroom
0
250
障害対応指揮の意思決定と情報共有における価値観 / Waroom Meetup #2
arthur1
3
280
Datachain会社紹介資料(2024年11月) / Company Deck
datachain
4
17k
エンジニア候補者向け資料2024.11.07.pdf
macloud
0
4.5k
株式会社ログラス − エンジニア向け会社説明資料 / Loglass Comapany Deck for Engineer
loglass2019
3
28k
End of Barrel Files: New Modularization Techniques with Sheriff
rainerhahnekamp
0
280
DatabricksにおけるLLMOpsのベストプラクティス
taka_aki
4
1.6k
地理情報データをデータベースに格納しよう~ GPUを活用した爆速データベース PG-Stromの紹介 ~
sakaik
1
110
AWS Lambdaと歩んだ“サーバーレス”と今後 #lambda_10years
yoshidashingo
1
110
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.4k
Being A Developer After 40
akosma
86
590k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
5 minutes of I Can Smell Your CMS
philhawksworth
202
19k
Raft: Consensus for Rubyists
vanstee
136
6.6k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
31
2.7k
How to train your dragon (web standard)
notwaldorf
88
5.7k
How STYLIGHT went responsive
nonsquared
95
5.2k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
42
9.2k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
42
2.2k
Transcript
強化学習で酔っ払いを学ぼう @canonno_blog
自己紹介 • 賀野 壮一朗 • 某飲料メーカー 入社三年目 • ピアノが趣味。作曲もぼちぼち。 •
ProtoOut 4期生。Tシャツ着てます • ウルトラソウルが大好き
業務でAI/機械学習の実装を担当
「こう来たらこう答えて」 教師あり学習 「データの癖を教えて」 教師なし学習 「最終的にこれを目指して」 強化学習
「こう来たらこう答えて」 教師あり学習 「最終的にこれを目指して」 強化学習 「データの癖を教えて」 教師なし学習
None
None
=
None
お酒好きですか???????
None
出口についたら+1。人にぶつかったら-1。 期待値的にどう行くのが一番良い?
berobero = 0.1
berobero = 0.3
IJIDEMO UE NI IKITAI
berobero = 0.5
GYAKUNI YOYUU
None
berobero = 0.1
berobero = 0.1 酔ってないし 突っ切ったろ
berobero = 0.1 やっぱ壁沿いで 無難にいきます
berobero = 0.3
KABEDUTAI NI IKU YOPPARAI NO TENKEI
berobero = 0.5
GYAKUNI YOYUU
強化学習もゆるゆる勉強しましょおう