Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
評価指標入門を読んでみた
Search
NearMeの技術発表資料です
PRO
June 09, 2023
Business
0
220
評価指標入門を読んでみた
NearMeの技術発表資料です
PRO
June 09, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
5
Box-Muller法
nearme_tech
PRO
1
16
Kiro触ってみた
nearme_tech
PRO
0
52
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
4
380
ReactNative のアップグレード作業が (意外に)楽しかった話
nearme_tech
PRO
2
96
強化学習アルゴリズムPPOの改善案を考えてみた
nearme_tech
PRO
0
34
Apple Containerについて調べて触ってみた
nearme_tech
PRO
0
440
Rust 並列強化学習
nearme_tech
PRO
0
32
並列で⽣成AIにコーディングをやらせる
nearme_tech
PRO
1
220
Other Decks in Business
See All in Business
メドピアグループ紹介資料
medpeer_recruit
10
140k
株式会社トリビュー|会社説明資料 / Company Deck
tribeau
5
20k
スクラム再始動 〜場づくりで透明性を促進し、『形骸化』から脱出しよう!〜
nato
0
160
ソフトウェア開発者が「感性」を磨く時代へ〜匠Methodが導く新しいスキルの方向性 / The Era of Software Developers Cultivating “Sensitivity” ~ The New Direction in Skills Guided by the Takumi Method ~
takumi_method_ug
1
120
「原因不明なナゾの障害」で終わらないための Kubernetes のログの徹底活用
googlecloudjapan
0
220
THxApp project
shotaro0913
0
450
【Omiai】リアーキ LT_202510
enito
PRO
1
240
enechain company deck_english
enechain
PRO
0
110
2025年10月副業制度運用者の実態調査
fkske
0
150
データ整備の「やり方」はどうなっていくか
shinu
PRO
2
650
会社紹介資料
gatechnologies
2
120k
株式会社ドリコム_事業計画及び成長可能性に関する説明資料
drecom_hr
0
2.6k
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
49
14k
Stop Working from a Prison Cell
hatefulcrawdad
272
21k
Gamification - CAS2011
davidbonilla
81
5.5k
Git: the NoSQL Database
bkeepers
PRO
431
66k
For a Future-Friendly Web
brad_frost
180
10k
Optimizing for Happiness
mojombo
379
70k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
Building Applications with DynamoDB
mza
96
6.7k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.2k
Facilitating Awesome Meetings
lara
57
6.6k
YesSQL, Process and Tooling at Scale
rocio
173
15k
Transcript
0 評価指標入門を読んでみた 2023-06-09 第47回NearMe技術勉強会 Takuma Kakinoue
1 レビュー • 評価指標入門(技術評論社) ◦ 総評:技術書というより、データサイエンティストの 心構えが学べる本。 ▪
良かった点 • 機械学習とビジネスのつながりが詳しく書いてある。 • 他の参考書にはない視点で語っており、 ハッと気づかされたことが多い。 ▪ 個人的にイマイチだった点 • 機械学習の誤差関数(RMSEなど)についての説明が若干長かった。 (ある程度、機械学習やってる人なら当たり前に 知ってそう)
2 評価指標入門の概要 • 近年のデータサイエンス事情 ◦ モデルの性能に固執するデータサイエンティストが増えた • 高性能な機械学習モデル ≠
ビジネス上で価値のあるモデル ◦ モデルの評価指標(損失関数)とビジネスの評価指標(KPI)は異なる • データサイエンティストの役割はサイエンスとビジネスの橋渡し ◦ ビジネスの問題をどうやってサイエンスの問題へ落とし込むか ▪ 評価指標、問題設定 そもそも企業のデータサイエンティストは売上を伸ばすために雇われている!
3 適切な評価指標を選ぶ • ECサイトでのクーポン配布の例 ◦ 男性と女性のどちらにクーポンを配布すべきかの意思決定に機械学習を用いる ▪ 性別に応じて、クーポン配布によって売上がいくら伸びるか予測するモデルを作った ◦ モデルAの方が誤差が少ないので、モデルAを意思決定に使おう!
▪ モデルAによると、男性にクーポンを配布すれば売上が伸びる! • しかし、実際は、男性にクーポンを配布しても売上は-100になる... ◦ 評価指標を、平均絶対誤差ではなく、符号的中率にすれば良い! ※参考文献:評価指標入門
4 問題設定の再設計 • 回帰か?分類か? ◦ 株価の自動売買 ▪ 株価は連続値なので回帰問題として解きたくなる。 • しかし、連続値は取りうる値が無数にあるので予測が難しい。
▪ 結局、重要なのは上がるか下がるかの2択なので2値分類として解くことが多い。 ◦ 降水量の予測(あまりビジネスとは関係ないが..) ▪ これも一見、回帰問題で解きたくなるが.. ▪ 同じ入力に対しても、3mmにも6mmにもなり得る(多峰性がある)。 • 単一の値を学習する代わりに、離散的な確率分布を多クラス分類で学習する。 ※参考文献:評価指標入門
5 参考文献 • 評価指標入門,高柳慎一,長田怜士,技術評論社,2023
6 Thank you