Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
yurufuwaLT
Search
canonno
April 08, 2021
Technology
0
160
yurufuwaLT
canonno
April 08, 2021
Tweet
Share
More Decks by canonno
See All by canonno
[LINEDC]AIはLINE BOT周りをどう変えたか
canonno
0
90
【書評】2032年、日本がスタートアップのハブになる
canonno
0
87
communeLT
canonno
0
7.4k
enebularLT
canonno
0
280
Try_English_LT.pdf
canonno
1
330
IoT LT
canonno
0
370
Enebular LT
canonno
0
910
Other Decks in Technology
See All in Technology
Snowflake Intelligenceにはこうやって立ち向かう!クラシルが考えるAI Readyなデータ基盤と活用のためのDataOps
gappy50
0
270
スマートファクトリーの第一歩 〜AWSマネージドサービスで 実現する予知保全と生成AI活用まで
ganota
2
280
Rustから学ぶ 非同期処理の仕組み
skanehira
1
150
企業の生成AIガバナンスにおけるエージェントとセキュリティ
lycorptech_jp
PRO
2
190
エンジニアリングマネージャーの成長の道筋とキャリア / Developers Summit 2025 KANSAI
daiksy
2
460
サラリーマンの小遣いで作るtoCサービス - Cloudflare Workersでスケールする開発戦略
shinaps
2
470
Terraformで構築する セルフサービス型データプラットフォーム / terraform-self-service-data-platform
pei0804
1
190
データ分析エージェント Socrates の育て方
na0
5
600
「どこから読む?」コードとカルチャーに最速で馴染むための実践ガイド
zozotech
PRO
0
540
DDD集約とサービスコンテキスト境界との関係性
pandayumi
3
290
CDK CLIで使ってたあの機能、CDK Toolkit Libraryではどうやるの?
smt7174
4
190
品質視点から考える組織デザイン/Organizational Design from Quality
mii3king
0
210
Featured
See All Featured
Producing Creativity
orderedlist
PRO
347
40k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Documentation Writing (for coders)
carmenintech
74
5k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Git: the NoSQL Database
bkeepers
PRO
431
66k
RailsConf 2023
tenderlove
30
1.2k
How to train your dragon (web standard)
notwaldorf
96
6.2k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.7k
Building Better People: How to give real-time feedback that sticks.
wjessup
368
19k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Automating Front-end Workflow
addyosmani
1370
200k
Transcript
強化学習で酔っ払いを学ぼう @canonno_blog
自己紹介 • 賀野 壮一朗 • 某飲料メーカー 入社三年目 • ピアノが趣味。作曲もぼちぼち。 •
ProtoOut 4期生。Tシャツ着てます • ウルトラソウルが大好き
業務でAI/機械学習の実装を担当
「こう来たらこう答えて」 教師あり学習 「データの癖を教えて」 教師なし学習 「最終的にこれを目指して」 強化学習
「こう来たらこう答えて」 教師あり学習 「最終的にこれを目指して」 強化学習 「データの癖を教えて」 教師なし学習
None
None
=
None
お酒好きですか???????
None
出口についたら+1。人にぶつかったら-1。 期待値的にどう行くのが一番良い?
berobero = 0.1
berobero = 0.3
IJIDEMO UE NI IKITAI
berobero = 0.5
GYAKUNI YOYUU
None
berobero = 0.1
berobero = 0.1 酔ってないし 突っ切ったろ
berobero = 0.1 やっぱ壁沿いで 無難にいきます
berobero = 0.3
KABEDUTAI NI IKU YOPPARAI NO TENKEI
berobero = 0.5
GYAKUNI YOYUU
強化学習もゆるゆる勉強しましょおう