$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
最近のUplift Modeling手法にRでトライ
Search
hskksk
December 09, 2024
Technology
0
560
最近のUplift Modeling手法にRでトライ
Japan.R 2024のLTで使用したスライドです。
hskksk
December 09, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
MariaDB Connector/C のcaching_sha2_passwordプラグインの仕様について
boro1234
0
1k
障害対応訓練、その前に
coconala_engineer
0
170
フィッシュボウルのやり方 / How to do a fishbowl
pauli
2
350
「もしもデータ基盤開発で『強くてニューゲーム』ができたなら今の僕はどんなデータ基盤を作っただろう」
aeonpeople
0
200
マイクロサービスへの5年間 ぶっちゃけ何をしてどうなったか
joker1007
18
7.4k
接客歴・営業歴の方が長いエンジニアから見たre:Invent2025
yama3133
0
100
Connection-based OAuthから学ぶOAuth for AI Agents
flatt_security
0
270
まだ間に合う! Agentic AI on AWSの現在地をやさしく一挙おさらい
minorun365
17
2.3k
『君の名は』と聞く君の名は。 / Your name, you who asks for mine.
nttcom
1
100
Entity Framework Core におけるIN句クエリ最適化について
htkym
0
110
20251203_AIxIoTビジネス共創ラボ_第4回勉強会_BP山崎.pdf
iotcomjpadmin
0
120
ソフトウェアエンジニアとAIエンジニアの役割分担についてのある事例
kworkdev
PRO
0
120
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
Heart Work Chapter 1 - Part 1
lfama
PRO
3
35k
The Curious Case for Waylosing
cassininazir
0
190
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1k
Six Lessons from altMBA
skipperchong
29
4.1k
Highjacked: Video Game Concept Design
rkendrick25
PRO
0
240
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
140
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.8k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
120
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
0
240
Applied NLP in the Age of Generative AI
inesmontani
PRO
3
2k
Transcript
最近のUplift Modeling 手法にRでトライ Japan.R 2024 2024/12/7 保坂 桂佑
• 保坂桂佑(X: @free_skier) • ヘルスケアスタートアップでデータサイエンティストをしています • 趣味:スキー、インドカレーづくり、キーボード自作 • 著書(共著)に「Kaggleで勝つデータ分析の技術」があります 自己紹介
このLTで話すこと • Li, K., & Zhu, L. (2024, May). A
New Transformation Approach for Uplift Modeling with Binary Outcome で精度の良いUplift Modeling の新しい方法が提案された • 概要を紹介 • 簡単な実験結果を紹介
Uplift Modelingとは 統計的因果推論におけるConditional Average Treatment Effect(CATE) を求める手法 CATEは以下の式で表される ある特徴 Xi
= x を持つ対象への介入効果を推定する手法と言える
変数変換によるアプローチ アクション有無Yと介入有無Wに対する変数変換で求めたZ*を目的変数 とした回帰モデルを作ると、CATEを推定するモデルが作れる (pは傾向スコア) ケースごとのZ* の値
情報の無駄をなくす 前ページの方法では「介入しても来なかった」「介入しないで来なかった」が同じ扱 いだった 「介入しても来なかった」ことは、「介入しないで来なかった」ことよりは悪いので、 良し悪しの重みをつける方法が提案された A New Transformation Approach for
Uplift Modeling with Binary Outcome ケースごとのZ* の値
Cを変えるとどうなるか C=0は旧手法と同じ。Cを大きくすると、事例の評価がファジーになる
実験 • 介入効果がわかっている簡単なデータを作り、介入効果の推定精度 を比較 • 傾向スコアをロジスティック回帰で、介入効果の推定を線形回帰で実 施 ダミーデータのグラフィカルモデル ダミーデータを作るコード
結果 • Uplift Modelingの評価にはQini曲線とその下の面積を使う (ゲインチャートやAUCのようなものだと思ってください) • 元の方法よりもQini曲線下の面積が大きくなった(=高精度) • C=0.15の結果
Cをどんな値にすると精度がよくなるの? 精度を最大化するCがあるみたい 精度を 最大化するC
いつでも新手法のほうが精度いいの? • いろいろなシードのダミーデータで同じことを実験 • 旧手法の方が精度が良いこともあった。Cをチューニングするのが良さそう
まとめ • A New Transformation Approach for Uplift Modeling with
Binary Outcome で精度の良いUplift Modelingの新しい方法を紹介 • 簡単な実験で旧手法より精度が良くなることを確認 • データごとにCに最適値がありそう • データによっては旧手法(C=0)のほうが高精度の場合もある
ご清聴ありがとう ございました!