Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
評価指標入門を読んでみた
Search
NearMeの技術発表資料です
PRO
June 09, 2023
Business
250
0
Share
評価指標入門を読んでみた
NearMeの技術発表資料です
PRO
June 09, 2023
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
実務で役立つ幾何学 ボロノイ図の基礎から グラフ・ネットワーク応用まで
nearme_tech
PRO
0
28
SQL/ID抽出タスクから考える 実践的なハルシネーション対策
nearme_tech
PRO
0
45
OpenCode & Local LLM
nearme_tech
PRO
0
43
OpenCode Introduction
nearme_tech
PRO
0
40
【Browser Automation × AI】 Stagehandを試してみよう
nearme_tech
PRO
0
110
AIを用いた PID制御で部屋 の温度制御をしてみた
nearme_tech
PRO
0
110
CopilotKit + AG-UIを学ぶ
nearme_tech
PRO
3
460
Tile38 Overview
nearme_tech
PRO
0
90
Rust 製のコードエディタ “Zed” を使ってみた
nearme_tech
PRO
1
1.7k
Other Decks in Business
See All in Business
Anker Japan Corporate Deck 2026
anker_jp
0
1.8k
Copilotの監査ログはどこまでみれるのか
ponponmikankan
4
1.7k
株式会社ダイスネクスト会社案内
atsushitakahashi
0
230
Crisp Code inc.|コーポレート・サービス紹介 - Corporate & Services Introduction
so_kotani
0
520
会社紹介資料
gatechnologies
2
180k
Smart Share Recruiting Deck
smartshare
0
160
Product Management Summit 2026 リチェルカ登壇資料『PdMを廃止しました。』
recerqainc
6
9.5k
Global Vascular株式会社_会社紹介資料
globalvascular
0
140
Codexを安心して業務活用するには?──「権限・接続・実行」の考え方
hima2b4
0
220
「忙しいふり」を自覚する🫵 「個人の仕事の棚卸し」をどうやる?
rechiba3
0
650
Webinar 30.04.2026 La nueva regulación del sector eléctrico
neuroenergia
PRO
0
430
Claudeの基本と税理士事務所での使い方_202604
shinxtanaka
0
190
Featured
See All Featured
Test your architecture with Archunit
thirion
1
2.2k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
140
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
270
Raft: Consensus for Rubyists
vanstee
141
7.4k
How to build a perfect <img>
jonoalderson
1
5.5k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
Typedesign – Prime Four
hannesfritz
42
3k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
200
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
55k
The Pragmatic Product Professional
lauravandoore
37
7.3k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
180
Transcript
0 評価指標入門を読んでみた 2023-06-09 第47回NearMe技術勉強会 Takuma Kakinoue
1 レビュー • 評価指標入門(技術評論社) ◦ 総評:技術書というより、データサイエンティストの 心構えが学べる本。 ▪
良かった点 • 機械学習とビジネスのつながりが詳しく書いてある。 • 他の参考書にはない視点で語っており、 ハッと気づかされたことが多い。 ▪ 個人的にイマイチだった点 • 機械学習の誤差関数(RMSEなど)についての説明が若干長かった。 (ある程度、機械学習やってる人なら当たり前に 知ってそう)
2 評価指標入門の概要 • 近年のデータサイエンス事情 ◦ モデルの性能に固執するデータサイエンティストが増えた • 高性能な機械学習モデル ≠
ビジネス上で価値のあるモデル ◦ モデルの評価指標(損失関数)とビジネスの評価指標(KPI)は異なる • データサイエンティストの役割はサイエンスとビジネスの橋渡し ◦ ビジネスの問題をどうやってサイエンスの問題へ落とし込むか ▪ 評価指標、問題設定 そもそも企業のデータサイエンティストは売上を伸ばすために雇われている!
3 適切な評価指標を選ぶ • ECサイトでのクーポン配布の例 ◦ 男性と女性のどちらにクーポンを配布すべきかの意思決定に機械学習を用いる ▪ 性別に応じて、クーポン配布によって売上がいくら伸びるか予測するモデルを作った ◦ モデルAの方が誤差が少ないので、モデルAを意思決定に使おう!
▪ モデルAによると、男性にクーポンを配布すれば売上が伸びる! • しかし、実際は、男性にクーポンを配布しても売上は-100になる... ◦ 評価指標を、平均絶対誤差ではなく、符号的中率にすれば良い! ※参考文献:評価指標入門
4 問題設定の再設計 • 回帰か?分類か? ◦ 株価の自動売買 ▪ 株価は連続値なので回帰問題として解きたくなる。 • しかし、連続値は取りうる値が無数にあるので予測が難しい。
▪ 結局、重要なのは上がるか下がるかの2択なので2値分類として解くことが多い。 ◦ 降水量の予測(あまりビジネスとは関係ないが..) ▪ これも一見、回帰問題で解きたくなるが.. ▪ 同じ入力に対しても、3mmにも6mmにもなり得る(多峰性がある)。 • 単一の値を学習する代わりに、離散的な確率分布を多クラス分類で学習する。 ※参考文献:評価指標入門
5 参考文献 • 評価指標入門,高柳慎一,長田怜士,技術評論社,2023
6 Thank you