Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
yurufuwaLT
Search
canonno
April 08, 2021
Technology
0
180
yurufuwaLT
canonno
April 08, 2021
Tweet
Share
More Decks by canonno
See All by canonno
噂で聞いたSupabaseをハンズオン
canonno
0
170
[LINEDC]AIはLINE BOT周りをどう変えたか
canonno
0
170
【書評】2032年、日本がスタートアップのハブになる
canonno
0
110
communeLT
canonno
0
7.5k
enebularLT
canonno
0
290
Try_English_LT.pdf
canonno
1
350
IoT LT
canonno
0
380
Enebular LT
canonno
0
940
Other Decks in Technology
See All in Technology
Agentic Software Modernization - Back to the Roots (Zürich Agentic Coding and Architectures, März 2026)
feststelltaste
0
100
LINE Messengerの次世代ストレージ選定
lycorptech_jp
PRO
17
7.1k
【PyCon mini Shizuoka 2026】生成AI時代に画像処理やオーディオ処理のノードエディターを作る理由
kazuhitotakahashi
0
260
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
1 年間の育休から時短勤務で復帰した私が、 AI を駆使して立ち上がりを早めた話
lycorptech_jp
PRO
0
220
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
4
22k
What's new in Go 1.26?
ciarana
2
280
生成AI活用によるPRレビュー改善の歩み
lycorptech_jp
PRO
4
2k
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
15
95k
Secure Boot 2026 - Aggiornamento dei certificati UEFI e piano di adozione in azienda
memiug
0
130
ブラックボックス観測に基づくAI支援のプロトコルのリバースエンジニアリングと再現~AIを用いたリバースエンジニアリング~ @ SECCON 14 電脳会議 / Reverse Engineering and Reproduction of an AI-Assisted Protocol Based on Black-Box Observation @ SECCON 14 DENNO-KAIGI
chibiegg
0
130
Exadata Fleet Update
oracle4engineer
PRO
0
1.3k
Featured
See All Featured
Scaling GitHub
holman
464
140k
Unsuck your backbone
ammeep
672
58k
What does AI have to do with Human Rights?
axbom
PRO
1
2k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
97
Chasing Engaging Ingredients in Design
codingconduct
0
130
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
130
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
83
The Pragmatic Product Professional
lauravandoore
37
7.2k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Amusing Abliteration
ianozsvald
0
120
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
64
Transcript
強化学習で酔っ払いを学ぼう @canonno_blog
自己紹介 • 賀野 壮一朗 • 某飲料メーカー 入社三年目 • ピアノが趣味。作曲もぼちぼち。 •
ProtoOut 4期生。Tシャツ着てます • ウルトラソウルが大好き
業務でAI/機械学習の実装を担当
「こう来たらこう答えて」 教師あり学習 「データの癖を教えて」 教師なし学習 「最終的にこれを目指して」 強化学習
「こう来たらこう答えて」 教師あり学習 「最終的にこれを目指して」 強化学習 「データの癖を教えて」 教師なし学習
None
None
=
None
お酒好きですか???????
None
出口についたら+1。人にぶつかったら-1。 期待値的にどう行くのが一番良い?
berobero = 0.1
berobero = 0.3
IJIDEMO UE NI IKITAI
berobero = 0.5
GYAKUNI YOYUU
None
berobero = 0.1
berobero = 0.1 酔ってないし 突っ切ったろ
berobero = 0.1 やっぱ壁沿いで 無難にいきます
berobero = 0.3
KABEDUTAI NI IKU YOPPARAI NO TENKEI
berobero = 0.5
GYAKUNI YOYUU
強化学習もゆるゆる勉強しましょおう