Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
yurufuwaLT
Search
canonno
April 08, 2021
Technology
0
130
yurufuwaLT
canonno
April 08, 2021
Tweet
Share
More Decks by canonno
See All by canonno
communeLT
canonno
0
7.1k
enebularLT
canonno
0
220
Try_English_LT.pdf
canonno
1
250
IoT LT
canonno
0
330
Enebular LT
canonno
0
700
Other Decks in Technology
See All in Technology
株式会社EventHub・エンジニア採用資料
eventhub
0
1.9k
少数チームで挑む: SwiftUI, TCA, KMPを用いた 新規動画配信アプリ 「ABEMA Live」の開発について
tomu28
0
520
キャラクター制御のためのプロンプト術 for LINE Bot
uezo
0
520
オーナーシップを持つ領域を明確にする
konifar
8
1.2k
Aurora MySQL v3(MySQL8.0互換)の オンラインDDLの罠挙動を全バージョンで検証した
yutakikai
0
150
次世代Web認証「パスキー」 / mo-zatsudan-passkey
nkzn
22
13k
Microsoft Cloudで開発ライフサイクルを保護する
kkamegawa
0
140
SPI原点回帰論:事業課題とFour Keysの結節点を見出す実践的ソフトウェアプロセス改善 / DevOpsDays Tokyo 2024
visional_engineering_and_design
4
1.3k
人間の尊厳、幸福、アクセシビリティ / 第116回「WEB TOUCH MEETING」アクセシビリティSP
nulabinc
PRO
2
180
"好き"との生活/Regularly update profile with GitHub Actions
judeeeee
0
150
PHP"オレ"カンファレンスの告知
ysknsid25
0
320
巨大なテーブルのテーブル定義を無停止で安全に誰でも変更できるようにする / Table-definitions-for-huge-tables-can-be-modified-by-anyone-safely-and-non-disruptively
freee
1
720
Featured
See All Featured
StorybookのUI Testing Handbookを読んだ
zakiyama
10
4.6k
Done Done
chrislema
178
15k
Six Lessons from altMBA
skipperchong
19
3k
How to train your dragon (web standard)
notwaldorf
71
5.1k
RailsConf 2023
tenderlove
1
530
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
19
1.9k
Debugging Ruby Performance
tmm1
69
11k
Music & Morning Musume
bryan
40
5.6k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
1
3.4k
What’s in a name? Adding method to the madness
productmarketing
PRO
15
2.6k
Become a Pro
speakerdeck
PRO
9
4.5k
The Straight Up "How To Draw Better" Workshop
denniskardys
227
130k
Transcript
強化学習で酔っ払いを学ぼう @canonno_blog
自己紹介 • 賀野 壮一朗 • 某飲料メーカー 入社三年目 • ピアノが趣味。作曲もぼちぼち。 •
ProtoOut 4期生。Tシャツ着てます • ウルトラソウルが大好き
業務でAI/機械学習の実装を担当
「こう来たらこう答えて」 教師あり学習 「データの癖を教えて」 教師なし学習 「最終的にこれを目指して」 強化学習
「こう来たらこう答えて」 教師あり学習 「最終的にこれを目指して」 強化学習 「データの癖を教えて」 教師なし学習
None
None
=
None
お酒好きですか???????
None
出口についたら+1。人にぶつかったら-1。 期待値的にどう行くのが一番良い?
berobero = 0.1
berobero = 0.3
IJIDEMO UE NI IKITAI
berobero = 0.5
GYAKUNI YOYUU
None
berobero = 0.1
berobero = 0.1 酔ってないし 突っ切ったろ
berobero = 0.1 やっぱ壁沿いで 無難にいきます
berobero = 0.3
KABEDUTAI NI IKU YOPPARAI NO TENKEI
berobero = 0.5
GYAKUNI YOYUU
強化学習もゆるゆる勉強しましょおう