Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
yurufuwaLT
Search
canonno
April 08, 2021
Technology
0
160
yurufuwaLT
canonno
April 08, 2021
Tweet
Share
More Decks by canonno
See All by canonno
communeLT
canonno
0
7.4k
enebularLT
canonno
0
280
Try_English_LT.pdf
canonno
1
330
IoT LT
canonno
0
370
Enebular LT
canonno
0
880
Other Decks in Technology
See All in Technology
OPENLOGI Company Profile
hr01
0
67k
Geminiとv0による高速プロトタイピング
shinya337
1
270
LangSmith×Webhook連携で実現するプロンプトドリブンCI/CD
sergicalsix
1
230
B2C&B2B&社内向けサービスを抱える開発組織におけるサービス価値を最大化するイニシアチブ管理
belongadmin
1
6.9k
AI時代の開発生産性を加速させるアーキテクチャ設計
plaidtech
PRO
3
160
How Do I Contact HP Printer Support? [Full 2025 Guide for U.S. Businesses]
harrry1211
0
120
AWS Organizations 新機能!マルチパーティ承認の紹介
yhana
1
280
自律的なスケーリング手法FASTにおけるVPoEとしてのアカウンタビリティ / dev-productivity-con-2025
yoshikiiida
1
17k
ビズリーチが挑む メトリクスを活用した技術的負債の解消 / dev-productivity-con2025
visional_engineering_and_design
3
7.5k
Delta airlines Customer®️ USA Contact Numbers: Complete 2025 Support Guide
deltahelp
0
700
Operating Operator
shhnjk
1
590
KubeCon + CloudNativeCon Japan 2025 Recap
ren510dev
1
380
Featured
See All Featured
Music & Morning Musume
bryan
46
6.6k
Producing Creativity
orderedlist
PRO
346
40k
Raft: Consensus for Rubyists
vanstee
140
7k
How GitHub (no longer) Works
holman
314
140k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Thoughts on Productivity
jonyablonski
69
4.7k
Balancing Empowerment & Direction
lara
1
430
For a Future-Friendly Web
brad_frost
179
9.8k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
How to Think Like a Performance Engineer
csswizardry
25
1.7k
Designing Experiences People Love
moore
142
24k
Transcript
強化学習で酔っ払いを学ぼう @canonno_blog
自己紹介 • 賀野 壮一朗 • 某飲料メーカー 入社三年目 • ピアノが趣味。作曲もぼちぼち。 •
ProtoOut 4期生。Tシャツ着てます • ウルトラソウルが大好き
業務でAI/機械学習の実装を担当
「こう来たらこう答えて」 教師あり学習 「データの癖を教えて」 教師なし学習 「最終的にこれを目指して」 強化学習
「こう来たらこう答えて」 教師あり学習 「最終的にこれを目指して」 強化学習 「データの癖を教えて」 教師なし学習
None
None
=
None
お酒好きですか???????
None
出口についたら+1。人にぶつかったら-1。 期待値的にどう行くのが一番良い?
berobero = 0.1
berobero = 0.3
IJIDEMO UE NI IKITAI
berobero = 0.5
GYAKUNI YOYUU
None
berobero = 0.1
berobero = 0.1 酔ってないし 突っ切ったろ
berobero = 0.1 やっぱ壁沿いで 無難にいきます
berobero = 0.3
KABEDUTAI NI IKU YOPPARAI NO TENKEI
berobero = 0.5
GYAKUNI YOYUU
強化学習もゆるゆる勉強しましょおう