Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
評価指標入門を読んでみた
Search
NearMeの技術発表資料です
PRO
June 09, 2023
Business
0
230
評価指標入門を読んでみた
NearMeの技術発表資料です
PRO
June 09, 2023
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
実践で使えるtorchのテンソル演算
nearme_tech
PRO
0
4
ローカルLLMを⽤いてコード補完を⾏う VSCode拡張機能を作ってみた
nearme_tech
PRO
0
170
初めてのmarimo (ハンズオン)
nearme_tech
PRO
0
22
ローカルLLM
nearme_tech
PRO
0
41
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
26
Box-Muller法
nearme_tech
PRO
1
38
Kiro触ってみた
nearme_tech
PRO
0
320
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
4
560
ReactNative のアップグレード作業が (意外に)楽しかった話
nearme_tech
PRO
2
130
Other Decks in Business
See All in Business
目標の50記事を達成したわけだが
suzuki_tada
0
130
【新卒採用資料】Natee Company Deck _202512
nateehr
0
1.1k
ミツモアAI推進G AI活用Tips50
mmota
0
200
センス・トラスト福利厚生
sensetrust
0
2.7k
三井物産グループのデジタル証券〜千代田区・レジデンス〜徹底解説セミナー
c0rp_mdm
PRO
0
1.6k
株式会社琉球ウェルネス 会社説明資料
ryukyuwellness
0
180
カンパニーデック 2025.12.25
toggletest
0
1.3k
Forward Deployed Engineer(FDE)の戦略的価値
tame
0
140
セーフィー株式会社(Safie Inc.) 会社紹介資料
safie_recruit
6
400k
曖昧なLLMの出力をプロダクト価値へつなげる、要求の具体化と評価
zerebom
4
430
エンジニアよ痛みを知れ
nobuoooo
0
160
ホワイトプラス会社紹介資料 / wp_introduction
whiteplus_recruit
0
260
Featured
See All Featured
Paper Plane (Part 1)
katiecoart
PRO
0
2k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Automating Front-end Workflow
addyosmani
1371
200k
Are puppies a ranking factor?
jonoalderson
0
2.4k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
The Language of Interfaces
destraynor
162
25k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
57
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
200
Typedesign – Prime Four
hannesfritz
42
2.9k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
120
Transcript
0 評価指標入門を読んでみた 2023-06-09 第47回NearMe技術勉強会 Takuma Kakinoue
1 レビュー • 評価指標入門(技術評論社) ◦ 総評:技術書というより、データサイエンティストの 心構えが学べる本。 ▪
良かった点 • 機械学習とビジネスのつながりが詳しく書いてある。 • 他の参考書にはない視点で語っており、 ハッと気づかされたことが多い。 ▪ 個人的にイマイチだった点 • 機械学習の誤差関数(RMSEなど)についての説明が若干長かった。 (ある程度、機械学習やってる人なら当たり前に 知ってそう)
2 評価指標入門の概要 • 近年のデータサイエンス事情 ◦ モデルの性能に固執するデータサイエンティストが増えた • 高性能な機械学習モデル ≠
ビジネス上で価値のあるモデル ◦ モデルの評価指標(損失関数)とビジネスの評価指標(KPI)は異なる • データサイエンティストの役割はサイエンスとビジネスの橋渡し ◦ ビジネスの問題をどうやってサイエンスの問題へ落とし込むか ▪ 評価指標、問題設定 そもそも企業のデータサイエンティストは売上を伸ばすために雇われている!
3 適切な評価指標を選ぶ • ECサイトでのクーポン配布の例 ◦ 男性と女性のどちらにクーポンを配布すべきかの意思決定に機械学習を用いる ▪ 性別に応じて、クーポン配布によって売上がいくら伸びるか予測するモデルを作った ◦ モデルAの方が誤差が少ないので、モデルAを意思決定に使おう!
▪ モデルAによると、男性にクーポンを配布すれば売上が伸びる! • しかし、実際は、男性にクーポンを配布しても売上は-100になる... ◦ 評価指標を、平均絶対誤差ではなく、符号的中率にすれば良い! ※参考文献:評価指標入門
4 問題設定の再設計 • 回帰か?分類か? ◦ 株価の自動売買 ▪ 株価は連続値なので回帰問題として解きたくなる。 • しかし、連続値は取りうる値が無数にあるので予測が難しい。
▪ 結局、重要なのは上がるか下がるかの2択なので2値分類として解くことが多い。 ◦ 降水量の予測(あまりビジネスとは関係ないが..) ▪ これも一見、回帰問題で解きたくなるが.. ▪ 同じ入力に対しても、3mmにも6mmにもなり得る(多峰性がある)。 • 単一の値を学習する代わりに、離散的な確率分布を多クラス分類で学習する。 ※参考文献:評価指標入門
5 参考文献 • 評価指標入門,高柳慎一,長田怜士,技術評論社,2023
6 Thank you