Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
最近のUplift Modeling手法にRでトライ
Search
hskksk
December 09, 2024
Technology
0
530
最近のUplift Modeling手法にRでトライ
Japan.R 2024のLTで使用したスライドです。
hskksk
December 09, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
DevIO2025_継続的なサービス開発のための技術的意思決定のポイント / how-to-tech-decision-makaing-devio2025
nologyance
1
390
「Linux」という言葉が指すもの
sat
PRO
4
130
AIのグローバルトレンド2025 #scrummikawa / global ai trend
kyonmm
PRO
1
280
自作JSエンジンに推しプロポーザルを実装したい!
sajikix
1
180
サラリーマンの小遣いで作るtoCサービス - Cloudflare Workersでスケールする開発戦略
shinaps
2
440
Codeful Serverless / 一人運用でもやり抜く力
_kensh
7
420
企業の生成AIガバナンスにおけるエージェントとセキュリティ
lycorptech_jp
PRO
2
170
💡Ruby 川辺で灯すPicoRubyからの光
bash0c7
0
110
新アイテムをどう使っていくか?みんなであーだこーだ言ってみよう / 20250911-rpi-jam-tokyo
akkiesoft
0
260
Android Audio: Beyond Winning On It
atsushieno
0
120
Platform開発が先行する Platform Engineeringの違和感
kintotechdev
4
570
要件定義・デザインフェーズでもAIを活用して、コミュニケーションの密度を高める
kazukihayase
0
110
Featured
See All Featured
Agile that works and the tools we love
rasmusluckow
330
21k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
112
20k
A Tale of Four Properties
chriscoyier
160
23k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
13k
Done Done
chrislema
185
16k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3k
Mobile First: as difficult as doing things right
swwweet
224
9.9k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Rails Girls Zürich Keynote
gr2m
95
14k
Building Adaptive Systems
keathley
43
2.7k
Transcript
最近のUplift Modeling 手法にRでトライ Japan.R 2024 2024/12/7 保坂 桂佑
• 保坂桂佑(X: @free_skier) • ヘルスケアスタートアップでデータサイエンティストをしています • 趣味:スキー、インドカレーづくり、キーボード自作 • 著書(共著)に「Kaggleで勝つデータ分析の技術」があります 自己紹介
このLTで話すこと • Li, K., & Zhu, L. (2024, May). A
New Transformation Approach for Uplift Modeling with Binary Outcome で精度の良いUplift Modeling の新しい方法が提案された • 概要を紹介 • 簡単な実験結果を紹介
Uplift Modelingとは 統計的因果推論におけるConditional Average Treatment Effect(CATE) を求める手法 CATEは以下の式で表される ある特徴 Xi
= x を持つ対象への介入効果を推定する手法と言える
変数変換によるアプローチ アクション有無Yと介入有無Wに対する変数変換で求めたZ*を目的変数 とした回帰モデルを作ると、CATEを推定するモデルが作れる (pは傾向スコア) ケースごとのZ* の値
情報の無駄をなくす 前ページの方法では「介入しても来なかった」「介入しないで来なかった」が同じ扱 いだった 「介入しても来なかった」ことは、「介入しないで来なかった」ことよりは悪いので、 良し悪しの重みをつける方法が提案された A New Transformation Approach for
Uplift Modeling with Binary Outcome ケースごとのZ* の値
Cを変えるとどうなるか C=0は旧手法と同じ。Cを大きくすると、事例の評価がファジーになる
実験 • 介入効果がわかっている簡単なデータを作り、介入効果の推定精度 を比較 • 傾向スコアをロジスティック回帰で、介入効果の推定を線形回帰で実 施 ダミーデータのグラフィカルモデル ダミーデータを作るコード
結果 • Uplift Modelingの評価にはQini曲線とその下の面積を使う (ゲインチャートやAUCのようなものだと思ってください) • 元の方法よりもQini曲線下の面積が大きくなった(=高精度) • C=0.15の結果
Cをどんな値にすると精度がよくなるの? 精度を最大化するCがあるみたい 精度を 最大化するC
いつでも新手法のほうが精度いいの? • いろいろなシードのダミーデータで同じことを実験 • 旧手法の方が精度が良いこともあった。Cをチューニングするのが良さそう
まとめ • A New Transformation Approach for Uplift Modeling with
Binary Outcome で精度の良いUplift Modelingの新しい方法を紹介 • 簡単な実験で旧手法より精度が良くなることを確認 • データごとにCに最適値がありそう • データによっては旧手法(C=0)のほうが高精度の場合もある
ご清聴ありがとう ございました!