Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
最近のUplift Modeling手法にRでトライ
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
hskksk
December 09, 2024
Technology
0
570
最近のUplift Modeling手法にRでトライ
Japan.R 2024のLTで使用したスライドです。
hskksk
December 09, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
マネージャー視点で考えるプロダクトエンジニアの評価 / Evaluating Product Engineers from a Manager's Perspective
hiro_torii
0
190
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
270
生成AIと余白 〜開発スピードが向上した今、何に向き合う?〜
kakehashi
PRO
0
160
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
510
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
560
私たち準委任PdEは2つのプロダクトに挑戦する ~ソフトウェア、開発支援という”二重”のプロダクトエンジニアリングの実践~ / 20260212 Naoki Takahashi
shift_evolve
PRO
2
210
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
770
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
顧客との商談議事録をみんなで読んで顧客解像度を上げよう
shibayu36
0
320
Cloud Runでコロプラが挑む 生成AI×ゲーム『神魔狩りのツクヨミ』の裏側
colopl
0
140
コンテナセキュリティの最新事情 ~ 2026年版 ~
kyohmizu
6
2k
日本の85%が使う公共SaaSは、どう育ったのか
taketakekaho
1
240
Featured
See All Featured
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.1k
Chasing Engaging Ingredients in Design
codingconduct
0
110
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
0
160
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
1
58
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
120
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.3k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
750
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
170
From π to Pie charts
rasagy
0
130
The Pragmatic Product Professional
lauravandoore
37
7.1k
Documentation Writing (for coders)
carmenintech
77
5.3k
Writing Fast Ruby
sferik
630
62k
Transcript
最近のUplift Modeling 手法にRでトライ Japan.R 2024 2024/12/7 保坂 桂佑
• 保坂桂佑(X: @free_skier) • ヘルスケアスタートアップでデータサイエンティストをしています • 趣味:スキー、インドカレーづくり、キーボード自作 • 著書(共著)に「Kaggleで勝つデータ分析の技術」があります 自己紹介
このLTで話すこと • Li, K., & Zhu, L. (2024, May). A
New Transformation Approach for Uplift Modeling with Binary Outcome で精度の良いUplift Modeling の新しい方法が提案された • 概要を紹介 • 簡単な実験結果を紹介
Uplift Modelingとは 統計的因果推論におけるConditional Average Treatment Effect(CATE) を求める手法 CATEは以下の式で表される ある特徴 Xi
= x を持つ対象への介入効果を推定する手法と言える
変数変換によるアプローチ アクション有無Yと介入有無Wに対する変数変換で求めたZ*を目的変数 とした回帰モデルを作ると、CATEを推定するモデルが作れる (pは傾向スコア) ケースごとのZ* の値
情報の無駄をなくす 前ページの方法では「介入しても来なかった」「介入しないで来なかった」が同じ扱 いだった 「介入しても来なかった」ことは、「介入しないで来なかった」ことよりは悪いので、 良し悪しの重みをつける方法が提案された A New Transformation Approach for
Uplift Modeling with Binary Outcome ケースごとのZ* の値
Cを変えるとどうなるか C=0は旧手法と同じ。Cを大きくすると、事例の評価がファジーになる
実験 • 介入効果がわかっている簡単なデータを作り、介入効果の推定精度 を比較 • 傾向スコアをロジスティック回帰で、介入効果の推定を線形回帰で実 施 ダミーデータのグラフィカルモデル ダミーデータを作るコード
結果 • Uplift Modelingの評価にはQini曲線とその下の面積を使う (ゲインチャートやAUCのようなものだと思ってください) • 元の方法よりもQini曲線下の面積が大きくなった(=高精度) • C=0.15の結果
Cをどんな値にすると精度がよくなるの? 精度を最大化するCがあるみたい 精度を 最大化するC
いつでも新手法のほうが精度いいの? • いろいろなシードのダミーデータで同じことを実験 • 旧手法の方が精度が良いこともあった。Cをチューニングするのが良さそう
まとめ • A New Transformation Approach for Uplift Modeling with
Binary Outcome で精度の良いUplift Modelingの新しい方法を紹介 • 簡単な実験で旧手法より精度が良くなることを確認 • データごとにCに最適値がありそう • データによっては旧手法(C=0)のほうが高精度の場合もある
ご清聴ありがとう ございました!