Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
yurufuwaLT
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
canonno
April 08, 2021
Technology
0
180
yurufuwaLT
canonno
April 08, 2021
Tweet
Share
More Decks by canonno
See All by canonno
噂で聞いたSupabaseをハンズオン
canonno
0
160
[LINEDC]AIはLINE BOT周りをどう変えたか
canonno
0
160
【書評】2032年、日本がスタートアップのハブになる
canonno
0
110
communeLT
canonno
0
7.5k
enebularLT
canonno
0
290
Try_English_LT.pdf
canonno
1
340
IoT LT
canonno
0
380
Enebular LT
canonno
0
930
Other Decks in Technology
See All in Technology
What happened to RubyGems and what can we learn?
mikemcquaid
0
210
MySQLのJSON機能の活用術
ikomachi226
0
140
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
220
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
900
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
クレジットカード決済基盤を支えるSRE - 厳格な監査とSRE運用の両立 (SRE Kaigi 2026)
capytan
6
1.9k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
入社1ヶ月でデータパイプライン講座を作った話
waiwai2111
1
210
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
300
20260129_CB_Kansai
takuyay0ne
1
260
GSIが複数キー対応したことで、俺達はいったい何が嬉しいのか?
smt7174
3
130
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
960
Featured
See All Featured
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.4k
Unsuck your backbone
ammeep
671
58k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.6k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
Skip the Path - Find Your Career Trail
mkilby
0
52
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
61
52k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
Believing is Seeing
oripsolob
1
48
Speed Design
sergeychernyshev
33
1.5k
Six Lessons from altMBA
skipperchong
29
4.1k
Transcript
強化学習で酔っ払いを学ぼう @canonno_blog
自己紹介 • 賀野 壮一朗 • 某飲料メーカー 入社三年目 • ピアノが趣味。作曲もぼちぼち。 •
ProtoOut 4期生。Tシャツ着てます • ウルトラソウルが大好き
業務でAI/機械学習の実装を担当
「こう来たらこう答えて」 教師あり学習 「データの癖を教えて」 教師なし学習 「最終的にこれを目指して」 強化学習
「こう来たらこう答えて」 教師あり学習 「最終的にこれを目指して」 強化学習 「データの癖を教えて」 教師なし学習
None
None
=
None
お酒好きですか???????
None
出口についたら+1。人にぶつかったら-1。 期待値的にどう行くのが一番良い?
berobero = 0.1
berobero = 0.3
IJIDEMO UE NI IKITAI
berobero = 0.5
GYAKUNI YOYUU
None
berobero = 0.1
berobero = 0.1 酔ってないし 突っ切ったろ
berobero = 0.1 やっぱ壁沿いで 無難にいきます
berobero = 0.3
KABEDUTAI NI IKU YOPPARAI NO TENKEI
berobero = 0.5
GYAKUNI YOYUU
強化学習もゆるゆる勉強しましょおう