因果推論の基礎とその罠 _Basic and Trap of Causal Inference_#白金鉱業

ҼՌਪ࿦ͷجૅͱͦͷ᠘ Basic and Trap of Causal Inference

Basic and Trap of Causal Inference 免責事項 - 本登壇は個⼈の⾒解であり、所属する組織の公式⾒解ではありません。 -
伝わることに重点を置いているので、数式は正確ではないです。⼝頭でフォローします。 - ツイッターにたくさんつぶやくと運営&⾃分が喜びますので、たくさんツイートしてください。 2 /32

Basic and Trap of Causal Inference ⾃⼰紹介学⽣早稲⽥⼤学創造理⼯学研究科
経営システム⼯学専攻共同研究先のマーケティングデータ × データサイエンス仕事データサイエンティスト @BrainPad 2018年新卒強化学習 / NLP / 統計的因果推論 / 画像異常検知 / PM⾒習い趣味仁ノ平将⼈ Masato Ninohira (@nino_pira) Data Gateway Talk 主催ブログ︓下町データサイエンティストの⽇常 B’zファンフットサル 3 /32

Basic and Trap of Causal Inference 4 /32 個⼈的な宣伝想定よりも応募が来てないけど、じわじわと。。。。
Music Analytics 2020 / 01 / 18 (Sat.) @Hanzoumon #muana

Basic and Trap of Causal Inference お断り実は、3ヵ⽉しか因果推論を勉強していません - 間違っていることを話していましたら
ごめんなさい。。。 - 逆に⾔うと3ヵ⽉でここまでまとめられる⼈材がBPにはゴロゴロいます 5 /32 因果推論の基礎 - 初⼼者向け (Notガチ勢の⽅) - 岩波データサイエンスvol3 / ⾃分のブログのまとめ - データも岩波データサイエンスから引⽤登壇時間の制約 - 傾向スコアマッチングの説明まででTime up - 他⼿法はブログみてください IPW / Double Robust / Proximityマッチング / PDP Causal Tree(←ブログに書いてない)

Basic and Trap of Causal Inference そもそも因果推論って︖ 〇〇することによるXXXへの効果測定 - 広告の効果測定
- 喫煙したから肺がんになりやすいか - バント作戦が得点率を上げるか 6 /32

Basic and Trap of Causal Inference 詳しい背景的な話は先⽇#OpenBPで公開した資料を⾒てください 7 /32

Basic and Trap of Causal Inference 8 /32 今⽇の⽬標引⽤︓https://twitter.com/kaitendaentai/status/1052689241744896001
今⽇の⽬標スコープ外

Basic and Trap of Causal Inference 9 /32 以下を「うんうん。知ってる。」って⾔えたら完全に理解 (1)
反実仮想を⽤いた因果推論のお気持ち - 背景要因を揃えて、真の効果を算出 - 絶対守ろう「強く無視できる割り当て」 (2) 傾向スコアを⽤いた因果推論の⼿順と罠 - 傾向スコアモデリング / 分布の確認 - 傾向スコアマッチング (3) ちゃんと設計された A/Bテストは原点にして頂点

Basic and Trap of Causal Inference ⽬次 1. 因果推論 ~施策の本当の効果~
2. 傾向スコアを⽤いた因果効果推定 3. モデリング / マッチングの概要と罠を説明 4. 結局 A/B テストが最強 5. まとめ 9 /32

Basic and Trap of Causal Inference 11 /32 1. 因果推論~施策の本当の効果~

Basic and Trap of Causal Inference 12 /32 TVのCMを⾒るとアプリのプレイ時間が短くなる︕︖ CMはやらない⽅がいい︕︖
そんな訳ない。。。そもそもCMを⾒た / ⾒ていない⼈の背景要因が異なる CM CM CM / TV TV 背景が異なるので単純に⽐較してはいけない明らかに CMを⾒た⼈︓そもそも、アプリのプレイ時間が短い CMを⾒ていない⼈ ︓ そもそも、アプリの使⽤時間が⻑い岩波DSのデータ

Basic and Trap of Causal Inference 13 /32 理想的な⽐較⽤語
/ ノーテーション - 割り当て(treat)︓施策を受けたかのフラグ。z = 1 が施策を受けた⼈でテスト群と呼ぶ(逆はコントロール群)。 - 共変量(covariance)︓機械学習でいう特徴量。x - 施策の効果 (effect)︓アプリのプレイ時間などの⽬的変数。y1 ︓割り当てを受けたときの⽬的変数(逆はy0 ) - 因果効果︓割り当てを受けることで受けない時と⽐較し、⽬的変数の差がどれくらい⽣じるかやりたいこと背景要因(x)が揃ったデータ同⼠でのテスト / コントロール群の y の⽐較を⾏い因果効果を算出割り当てあり z=1 y1 割り当てによる効果の差分因果効果＝割り当てなし z=0 y0

Basic and Trap of Causal Inference 14 /32 困難ポイントこの⽐較が難しい問題
(1) 共変量の次元が⼤きいと類似度計算が難しい (2)「ランダム化⽐較試験(RCT)」できない観察実験 (3) そもそもテスト / コントロール群にしか存在しないデータがある = バイアスがある CMを⾒てない CMを⾒た理想的な⽐較︓同じ背景を持ったデータ同⼠の⽐較同じ背景要因 (共変量)を持ったデータ同⼠で⽐較現実的に不可能⾼年齢 TV派スマホ派

Basic and Trap of Causal Inference 15 /32 反実仮想ずばり、
「仮に施策を受けたら or 受けなかったら⽬的変数はどうであったか」と考える思想 CMを⾒た y1 y0 CMを⾒なかった Aさん⽋損この⽬的変数を算出し、y1と⽐較したいテスト群コントロール群観測⽋損⽋損観測 y1 y0 因果効果

Basic and Trap of Causal Inference 16 /32 2. 傾向スコアを⽤いた因果効果推定

Basic and Trap of Causal Inference 17 /32 共変量が同じであれば、割り当て
と⽬的変数の同時分布は独⽴解釈 - 割り当てがされる確率は、あくまでも共変量のみに依存し、⽬的変数には依存しない - 例えば、年齢 / 性別などの共変量のみが、割り当て(CMを⾒るか)に依存する - つまり共変量 (年齢性別など)が同じ個体であれば、割り当て(CMを⾒るか)される確率は同じ。男性 / 20代男性 / 20代同じ共変量 = CMを⾒る確率は同じ最⼤の罠共変量で完全に成⽴させる必要超絶重要条件︓強く無視できる割り当て STUVAについては#OpenBPの資料を参照してください

Basic and Trap of Causal Inference 18 /32 強く無視できる割り当てを確認する⽅法 -
便利な公式みたいなものは存在しない - 求められる圧倒的ドメイン知識 - こんな感じでドメイン知識が圧倒的に必要例えば、CMを⾒る確率を表現する上で、性別と年代だけでok︖ 地域 / スマホ使⽤時間も関係あるのでは︖ - ちゃんと観測データで強く無視できる割り当てが満たされている︖ 超絶重要

Basic and Trap of Causal Inference 19 /32 バランシングスコア /
傾向スコアの導⼊強く無視できる割り当てが成⽴していると仮定すると以下の2つが成⽴バランシングスコア同じ傾向スコアを持つテスト / コントロールの⽬的関数の差を傾向スコアで期待値共変量の関数でその値で条件つければと割り当てが独⽴になる関数 →最もシンプルな関数がを意味する傾向スコア⼤雑把に解釈︓

Basic and Trap of Causal Inference 20 /32 そう、これこそが傾向スコアマッチングテスト群
id 傾向スコア y A 0.8 10 B 0.7 20 C 0.5 30 D 0.2 40 id 傾向スコア y E 0.2 2 F 0.8 8 G 0.7 18 H 0.5 20 傾向スコアの同じデータ同⼠のペアを作る test ctr yの差 A F 10 – 8 = 2 B G 20 – 18 = 2 C H 30 – 20 = 10 D E 40 – 2 = 38 差の期待値 =(2 +2 +10 +38) / 4 = 13 解釈︓因果効果は13 コントロール群 / "! ※⾊々仮定は置いてます

Basic and Trap of Causal Inference 21 /32 ここまでの振り返り -
強く無視できる割り当て / 圧倒的ドメイン知識 - 傾向スコアマッチングこの辺

Basic and Trap of Causal Inference 22 /32 3. (最低限)傾向スコアモデリング
/ マッチングの概要と罠

Basic and Trap of Causal Inference 23 /32 有名⼿法は他にもあるが時間の関係でカット (ブログ読んでください)
参考︓時間の制約で他⼿法の説明はカット

Basic and Trap of Causal Inference 24 /32 全体の流れ傾向スコアモデリング
マッチング概要 - 傾向スコアを推定するモデルの作成評価 / 罠 - (c統計量) - 傾向スコアの分布概要 - 1 on 1マッチ(のみを紹介) 評価 / 罠 - Standard Difference

Basic and Trap of Causal Inference 25 /32 傾向スコアモデリング概要
評価 / 罠傾向スコアを推定するモデルの学習 (適当な2値分類モデル) (1)C統計量 (機械学習でいうAUC)で評価︖ たまに（︖）「c統計量が0.7以上ならok」って⾒解を⾒かけるが本当︖ 値そのものよりも分布の確認では︖ (2)傾向スコアの分布仮に、傾向スコアが正しく振れているならば傾向スコア0.1 (テスト群のデータ︓コントロール群のデータ) = 1 : 9 傾向スコア0.5 (テスト群のデータ︓コントロール群のデータ) = 5 : 5 傾向スコア0.9 (テスト群のデータ︓コントロール群のデータ) = 9 : 1 の割合でデータが存在するはずダメなパターン︓分布が偏る原因 - nが⾜りてない - そもそもテスト / コントロール群の性質が異なるコントロール群テスト群傾向スコア頻度理想的な傾向スコアのヒストグラムダメなパターン

Basic and Trap of Causal Inference 26 /32 マッチング概要
評価 / 罠算出された傾向スコアを⽤いて - 傾向スコアが近いテスト / コントロールデータのペアリング - 因果効果︓マッチしたペアのyの差分の平均値 id y A 0.8 10 B 0.7 20 C 0.5 30 D 0.2 40 id y E 0.2 2 F 0.8 8 G 0.7 18 H 0.5 20 test ctr y A F 10 – 8 = 2 B G 20 – 18 = 2 C H 20 – 20 = 10 D E 40 – 2 = 38 =(2 +2 +10 +38) / 4 = 13 13 (1)Standard Differenceで評価意味︓ペアリングに⽤いられたテスト / コントロール群のデータの共変量に差がないかどの共変量を使う︖︓モデル作成の際にimportanceが⾼い共変量 * 多くの論⽂では全共変量に対してSDを算出しているが、、、 (2)テスト or コントロールのどちらかのデータが少ないとペア数が減る

Basic and Trap of Causal Inference 27 /32 ここまでの振り返り -
傾向スコアモデリング / 分布の確認 - 傾向スコアマッチングこの辺

Basic and Trap of Causal Inference 28 /32 4. 結局
A/B テストが最強

Basic and Trap of Causal Inference 29 /32 因果推論は制約強すぎ強く無視できる割り当て
ドメイン知識傾向スコアの分布データ量 /質マッチング安易に「因果推論使えば効果検証できるんでしょ︖」は絶対ダメ

Basic and Trap of Causal Inference 30 /32 ちゃんと設計されたA/Bテストが理想的最低限考えるべき事項
- KPI設計 / 施策とKPIの関係 - ABの設計ちゃんと設計されたA/Bテストこそ原点にして頂点この辺は私よりも事業会社のデータサイエンティストの⽅が圧倒的に詳しいただし、「ちゃんと考えた」ABテスト

Basic and Trap of Causal Inference 31 /32 4. まとめ

Basic and Trap of Causal Inference 32 /32 以下を「うんうん。知ってる。」って⾔えたら完全に理解 (1)
反実仮想を⽤いた因果推論のお気持ち - 背景要因を揃えて、真の効果を算出 - 絶対守ろう「強く無視できる割り当て」 (2) 傾向スコアを⽤いた因果推論の⼿順と罠 - 傾向スコアモデリング / 分布の確認 - 傾向スコアマッチング (3) ちゃんと設計された A/Bテストは原点にして頂点 Thank you for listening

因果推論の基礎とその罠 _Basic and Trap of Causal Inference...

因果推論の基礎とその罠 _Basic and Trap of Causal Inference_#白金鉱業

ninohira

More Decks by ninohira

Featured

Transcript

ҼՌਪ࿦ͷجૅͱͦͷ᠘ Basic and Trap of Causal Inference

Basic and Trap of Causal Inference 免責事項 - 本登壇は個⼈の⾒解であり、所属する組織の公式⾒解ではありません。 -

Basic and Trap of Causal Inference ⾃⼰紹介学⽣早稲⽥⼤学創造理⼯学研究科

Basic and Trap of Causal Inference 4 /32 個⼈的な宣伝想定よりも応募が来てないけど、じわじわと。。。。

Basic and Trap of Causal Inference お断り実は、3ヵ⽉しか因果推論を勉強していません - 間違っていることを話していましたら

Basic and Trap of Causal Inference そもそも因果推論って︖ 〇〇することによるXXXへの効果測定 - 広告の効果測定

Basic and Trap of Causal Inference 詳しい背景的な話は先⽇#OpenBPで公開した資料を⾒てください 7 /32

Basic and Trap of Causal Inference 8 /32 今⽇の⽬標引⽤︓https://twitter.com/kaitendaentai/status/1052689241744896001

Basic and Trap of Causal Inference 9 /32 以下を「うんうん。知ってる。」って⾔えたら完全に理解 (1)

Basic and Trap of Causal Inference ⽬次 1. 因果推論 ~施策の本当の効果~

Basic and Trap of Causal Inference 11 /32 1. 因果推論~施策の本当の効果~

Basic and Trap of Causal Inference 12 /32 TVのCMを⾒るとアプリのプレイ時間が短くなる︕︖ CMはやらない⽅がいい︕︖

Basic and Trap of Causal Inference 13 /32 理想的な⽐較⽤語

Basic and Trap of Causal Inference 14 /32 困難ポイントこの⽐較が難しい問題

Basic and Trap of Causal Inference 15 /32 反実仮想ずばり、

Basic and Trap of Causal Inference 16 /32 2. 傾向スコアを⽤いた因果効果推定

Basic and Trap of Causal Inference 17 /32 共変量が同じであれば、割り当て

Basic and Trap of Causal Inference 18 /32 強く無視できる割り当てを確認する⽅法 -

Basic and Trap of Causal Inference 19 /32 バランシングスコア /

Basic and Trap of Causal Inference 20 /32 そう、これこそが傾向スコアマッチングテスト群

Basic and Trap of Causal Inference 21 /32 ここまでの振り返り -

Basic and Trap of Causal Inference 22 /32 3. (最低限)傾向スコアモデリング

Basic and Trap of Causal Inference 23 /32 有名⼿法は他にもあるが時間の関係でカット (ブログ読んでください)

Basic and Trap of Causal Inference 24 /32 全体の流れ傾向スコアモデリング

Basic and Trap of Causal Inference 25 /32 傾向スコアモデリング概要

Basic and Trap of Causal Inference 26 /32 マッチング概要

Basic and Trap of Causal Inference 27 /32 ここまでの振り返り -

Basic and Trap of Causal Inference 28 /32 4. 結局

Basic and Trap of Causal Inference 29 /32 因果推論は制約強すぎ強く無視できる割り当て

Basic and Trap of Causal Inference 30 /32 ちゃんと設計されたA/Bテストが理想的最低限考えるべき事項

Basic and Trap of Causal Inference 31 /32 4. まとめ

Basic and Trap of Causal Inference 32 /32 以下を「うんうん。知ってる。」って⾔えたら完全に理解 (1)