Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
効果検証入門#1 セレクションバイアスとRCT
Search
Tsuchinoko
September 25, 2021
Science
0
520
効果検証入門#1 セレクションバイアスとRCT
「効果検証入門」著者:安井翔太+監修:株式会社ホクソエム
1章セレクションバイアスとRCT
の学習記録。
・介入効果
・セレクションバイアス
・RCT
Tsuchinoko
September 25, 2021
Tweet
Share
Other Decks in Science
See All in Science
baseballrによるMLBデータの抽出と階層ベイズモデルによる打率の推定 / TokyoR118
dropout009
2
640
コンピュータビジョンによるロボットの視覚と判断:宇宙空間での適応と課題
hf149
1
480
機械学習 - SVM
trycycle
PRO
1
950
中央大学AI・データサイエンスセンター 2025年第6回イブニングセミナー 『知能とはなにか ヒトとAIのあいだ』
tagtag
PRO
0
100
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
500
学術講演会中央大学学員会府中支部
tagtag
PRO
0
340
Kaggle: NeurIPS - Open Polymer Prediction 2025 コンペ 反省会
calpis10000
0
310
My Little Monster
juzishuu
0
370
Accelerated Computing for Climate forecast
inureyes
PRO
0
140
Hakonwa-Quaternion
hiranabe
1
170
(メタ)科学コミュニケーターからみたAI for Scienceの同床異夢
rmaruy
0
150
MCMCのR-hatは分散分析である
moricup
0
550
Featured
See All Featured
Rails Girls Zürich Keynote
gr2m
95
14k
Paper Plane (Part 1)
katiecoart
PRO
0
2.4k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.3k
AI: The stuff that nobody shows you
jnunemaker
PRO
1
37
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Designing for Timeless Needs
cassininazir
0
110
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.8k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Building AI with AI
inesmontani
PRO
1
590
How Software Deployment tools have changed in the past 20 years
geshan
0
30k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
260
Transcript
ち の つ こ 効果検証入門 #1 セレクションバイアスとRCT @tsuchinokotar0
ち の つ こ 2 介入効果 施策を実行した時に、施策がKPIに影響を与えた効果=介入効果 母集団 無作為抽出 (RCT)
介入あり集団 介入なし集団 メール配信 (介入) 比較 介入(処置) 集団A 集団B 売上up!! 売上 (KPI) 配信 (集団A) 未配信 (集団B) メール配信により増加 した売上=介入効果 図 介入後の集団A-B間の売上比較 (理想) ユーザ𝑖に対する介入を𝑍𝑖 とすると、以下のように表せる。 𝑍𝑖 = ൝ 0 (メール配信あり) 1 (メール配信なし) この時、ユーザ𝑖の売上𝑌𝑖 は以下のように表せる。 𝑌𝑖 = ቐ 𝑌 𝑖 (0) (𝑍𝑖 = 0) 𝑌 𝑖 (1) (𝑍𝑖 = 1) 実務では、 𝒀 𝒊 (𝟎)と𝒀 𝒊 (𝟏)を同時に観測することは困難なので、 平均的な効果(ATE:Average Teratment Effect) を測る。 𝜏 = 𝔼 𝑌(1) − 𝔼 𝑌(0) 𝔼 𝑌(1) 𝔼 𝑌(0) 𝜏 課題:“入手可能データから、如何に正しくATEを推定するか” ▪例:メールマーケティング 無作為抽出したユーザにメール配信(介入)を行い、売上(KPI)を比較
ち の つ こ セレクションバイアス 3 母集団 購買傾向によって 集団を分類 介入あり集団
介入なし集団 メール配信 (介入) 比較 集団A 集団B 売上up!! 真の介入効果を 推定出来ない ▪セレクションバイアスとは 比較対象の集団間の潜在的な傾向が異なる場合に発生するバイアス ▪例:メールマーケティング 購買傾向の高いユーザに重点的にメール配信を行い、売上を比較 購買傾向が 高い集団 購買傾向が 低い集団 売上 (KPI) 配信(集団A) 未配信(集団B) メール配信により増加した売上 =介入効果 図 介入後の集団A-B間の売上比較(実務想定) 𝔼 𝑌(0)|𝑍 = 1 潜在的な売上の差 =セレクションバイアス 𝑍 𝑌 𝑌(0) 𝑌(1) 1 (メール配信) 𝑌(0)|𝑍 = 1 (欠測) 𝑌(1)|𝑍 = 1 (観測) 0 (メール未配信) 𝑌(0)|𝑍 = 0 (観測) 𝑌(1)|𝑍 = 0 (欠測) 𝜏 𝔼 𝑌(0)|𝑍 = 0 𝔼 𝑌(1)|𝑍 = 1 𝔼 𝑌(0)|𝑍 = 1 − 𝔼 𝑌(0)|𝑍 = 0 𝜏𝑛𝑎𝑖𝑣𝑒 実務では、𝒀(𝟎)|𝒁 = 𝟏と𝒀(𝟏)|𝒁 = 𝟎は観測できない。 この時、単純に平均的な効果を測ると以下のように表せ る。 𝜏𝑛𝑎𝑖𝑣𝑒 = 𝔼 𝑌 1 |𝑍 = 1 − 𝔼 𝑌 0 |𝑍 = 0 = 𝜏 + 𝔼 𝑌 0 |𝑍 = 1 − 𝔼 𝑌 0 |𝑍 = 0 つまり、 比較対象の集団に潜在的な差が存在する場合、真の介入 効果を推定することが出来ない。 例では、購買傾向と売上に正の相関があるとすると、 購買傾向が高い集団 → 売上高い集団 購買傾向が低い集団 → 売上低い集団 であり、潜在的な売上の差が存在するため、真の介入効 果を推定出来ない。 集団Aと集団Bの潜在的な売上の差 (セレクションバイアス) 真の効果 表 売上𝑌の欠損/観測状態(実務想定) セレクションバイアスの影響 を排除した比較が重要
ち の つ こ 解決策:無作為化比較試験(RCT: Randomized Controlled Trial ) 4
▪無作為化比較試験とは ランダムに抽出した集団にて、施策の効果を比較すること → セレクションバイアスを緩和可能 (平均化により集団間の潜在的な偏りが緩和) 母集団 無作為化比較試験 集団A 集団B 購買傾向によって集団を分類 集団C 集団D 購買傾向が 高い集団 購買傾向が 低い集団 平均的には 同質の集団 売上 (KPI) 集団A 集団B 売上 (KPI) 集団C 集団D 母集団の平均 母集団の平均 平均的に同質の集団 介入後の変化=介入効果 平均的に異質の集団 介入後の変化 =介入効果+バイアス RCTは効果検証として理想だが、実務では実施コストが大きい or 実施が不可能
ち の つ こ 次回:介入効果を測るための回帰分析 5