Upgrade to Pro — share decks privately, control downloads, hide ads and more …

RDDによる因果推論

Avatar for akki- akki-
April 17, 2025
180

 RDDによる因果推論

Avatar for akki-

akki-

April 17, 2025
Tweet

Transcript

  1. © GO Inc. 2 自己紹介 GO株式会社 AI技術開発部 分析グループ / 秋月

    達樹 工場勤務から海外駐在を経験したのち、人材事業と広告事業においてデータ分 析や機械学習エンジニアリングを担当。 2021年4月にGO株式会社(旧・ Mobility Technologies)に中途入社しデータ分析を担当 ------------------------------------------ @akidukin
  2. © GO Inc. • 何かしらの介入(𝑇)が与える結果(𝑌)への影響や関係を統計的に把握する手法 • 個別の因果効果は現実的に推定することが出来ないため統計的な推定をする必要がある 統計的因果推論とは 介入 結果

    𝑇 = 1 𝑇 = 0 Y 介入の割当結果はどちらかしか観測することができない 介入による因果効果は統計的に推定する必要がある 介入割当 結果 個別因果効果 𝜏 = Y T = 1 − Y(T = 0) Y 𝜏:効果量 𝑇 𝑌 5
  3. © GO Inc. • 因果効果を単純集計をしてしまうと推定値にバイアスが紛れてしまう場合がある • 共変量が与える影響を考慮しなければ分析結果が歪んでしまう 因果効果推定におけるバイアスの発生 𝑇 𝑌

    𝑋 ダイエット BMI 体重減量 ダイエットあり ダイエットなし BMI(x<35) BMI(x>35) 体重 減量 ダイエットによる体重減量への影響 全体で因果効果を計測するとダイエットをした方が 体重減量への影響がない結果が見られる BMIがダイエットをするかどうかに影響を与えており 単純集計をしてしまうと影響を受けてしまう 6
  4. © GO Inc. • 共変量によるバイアスは調整をすることで除去することができる • 調整手法は今回紹介する層別化以外にも存在する 共変量を調整しバイアスを除去する ダイエットあり ダイエットなし

    体重 減量 ダイエットあり ダイエットなし 体重 減量 個別の因果効果を重み付け平均し 因果効果を算出する 得られたデータを共変量ごとに分けて 層別に因果効果を推定する BMI(x<35) BMI(x>35) ダイエットあり ダイエットなし 体重 減量 BMI(x<35) BMI(x>35) 7
  5. © GO Inc. • 介入割付の条件に特定の変数に閾値が設けられた場合は調整によるバイアス調整が難しい • この様な施策デザインの時にRDDと呼ばれる因果推論のフレームワークを使う事で因果効 果の推定ができる 介入に閾値を設けた場合 BMI

    ダイエット 実施人数 介入の割当が閾値を超えたかどうかで決まる場合に RDDを使う事で因果効果の推定ができる 35 BMIの値が35を超えた時、医師の判断により強制的に ダイエットを実施しなければならないとする。 BMIが35以上のサンプルしか介入を受けていないため 層別化による調整が難しい 9
  6. © GO Inc. • RDDによって得られた介入効果の結果はいくつかの仮定を満たすと信頼できるものになる • すごく雑にいうと「閾値周辺のサンプルは傾向が似ており、そのサンプルを比較する事で 因果効果が推定できる」という考え方 RDDの仮定 割当変数の操作ができない

    共変量に連続性がある 割当ルールと閾値が明確 https://www.jstage.jst.go.jp/article/ace/4/1/4_22001/_html/-char/en RDDでは割当変数が閾値を超えた場合に介入が割当されると想定される。 介入の割当ルールと閾値が明確で集団全体に対して実施されている必要がある。 もし明確では無い場合(個々でルールや閾値が変わる)場合はRDDは実施できない 介入前の割当変数は介入の有無によって影響を受けてはならない。 個々のサンプルが恣意的に割当変数を変化させて介入を受ける様に操作できる場合 はRDDによる結果はバイアスを受けてしまう。 閾値付近において介入の有無以外の要素が不連続ではない 閾値を超えた場合と超えなかった場合で結果に影響を与える共変量の分布に大きな 違いがないことを前提とする。 12
  7. © GO Inc. • RDDによって得られた介入効果は局所的な因果効果(LATE)として解釈できる • 集団に対するATEとして解釈するためにはさらに前提条件と検討が必要である RDDにより得られる因果効果 閾値付近のデータを利用して因果効果を推定する 𝜏

    = lim 𝑥→𝑐 𝐸 𝑌𝑖 1 𝑋𝑖 = 𝑋0 − lim 𝑐→𝑥 𝐸 𝑌𝑖 0 𝑋𝑖 = 𝑋0 介入割当があった 場合の期待値 介入割当がなかった 場合の期待値 推定したい 因果効果 割当変数 結果 変数 13
  8. © GO Inc. • RDDには2種類の割付条件(施策デザイン)が考えられる RDDの種類 Sharp RDD 閾値を超えると強制的に介入の割り当てが実施される 実験デザイン。閾値によって介入の割り当てが完全遵

    守される場合をSharpデザインと呼ぶ。 Fuzzy RDD 何かしらの要因により閾値を超えなくても介入の割 当が実施される実験デザイン。閾値による完全遵守 がされない(不完全遵守)場合をFuzzyデザインと呼ぶ 割当 確率 割当変数 割当 確率 割当変数 14
  9. © GO Inc. • 介入の割当が閾値によって完全に決定される実験デザイン ◦ 補助金の付与や運転免許の取得可否、選挙権の付与有無 など • 閾値を超えた全てのデータが介入を受け、超えなかったデータは介入を受けない

    Sharp RDD 割当 確率 割当変数 𝑥→𝑐0 𝑇 𝑌 介入の割当が割当変数が閾値を超えたかどうかで決定さ れる。それ以外の要素は介入の割当に影響を与えない 閾値 15
  10. © GO Inc. • 介入の割当が閾値と未観測の変数によって決定される状況 ◦ 奨学金の付与、補習授業の受講などが挙げられる • SharpRDDの枠組みで因果効果を推定すると未観測の変数により推定結果にバイアスが発 生してしまう

    Fuzzy RDD 割当 確率 割当変数 閾値 𝑥→𝑐0 𝑇 𝑌 介入の割当が割当変数が閾値を超えたかどうかの 他に未観測の交絡変数によって決定される 𝑈 16
  11. © GO Inc. • 以降は推定方法について重点を置いて説明する RDDによる分析手順 割当ルールの判定・RDD妥当性チェック パラメトリック推定 割当変数と結果変数の可視化 ノンパラメトリック推定

    ロバストネスチェック Fuzzy or Sharp 線形 or 非線形 ・バンド幅の調整 ・カーネル関数の調整 結果の解釈 ・関数の調整 ・交絡因子の削除・導入 ・多項式の削除・導入 18
  12. © GO Inc. • 割当変数と結果の間に線形性が仮定できる場合シンプルな回帰問題として推定できる • 回帰分析の結果得られる𝛽2 が因果効果として解釈できる 線形性が仮定できる場合の推定 -

    SharpRDD 因果効果の推定はシンプルな線形回帰分析で出来る 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝛽2 1(𝑥𝑖 ≥ 𝑐0 ) + 𝜖 この時の𝛽2 が推定された因果効果とみなせる 推定したい 因果効果 割当変数 結果 変数 19
  13. © GO Inc. • 閾値周辺で傾きが変化する場合、介入と割当変数が交互作用していることが考えられる • RDDの線形式に交互作用項を盛り込むことで因果効果を正しく推定することができる 閾値周辺で傾きが変化する場合 - SharpRDD

    線形回帰式に対して交互作用項を組み込む 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝛽2 (𝑥𝑖 ≥ 0) + 𝛽3 𝑥𝑖 (𝑥𝑖 ≥ 0) + 𝜖 この時の𝛽2 が推定された因果効果とみなせる 推定したい 因果効果 交互作用項を含ま ない場合の推定 割当変数 結果 変数 20
  14. © GO Inc. • 閾値で割当変数を中心化する事で推定効果の解釈が容易になる • 中心化する事で閾値周辺の介入効果をより正確に推定する事ができる 閾値で割当変数を中心化する - SharpRDD

    割当変数を閾値で中心化する 𝑥𝑐 = 𝑥𝑖 − 𝑐0 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝛽2 (𝑥𝑐 ≥ 0) + 𝛽3 𝑥𝑖 (𝑥𝑐 ≥ 0) + 𝜖 この時の𝛽2 が推定された因果効果とみなせる 割当変数 結果 変数 中心化した場合 に推定される 因果効果 中心化しなかった 場合に推定される 因果効果 ※…交互作用項が含まれない場合にモデルに交互作用項を盛り込んだと しても𝛽2 の値は同じになる。。。はず、なのでRDDによる因果効果の推 定は、基本的に割当変数を中心化して交互作用項を組み込んで推定する 21
  15. © GO Inc. • 線形性が仮定できない場合にそのまま因果効果を推定してしまうとバイアスが発生する • 高次多項式によるフィッティングを行いRDDを実行する場合がある Sharp RDD (線形性が仮定できない場合)

    高次多項式によるフィッティングを行う。 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝛽2 (𝑥𝑐 ≥ 0) + 𝛽3 𝑥𝑖 2 + ⋯+ 𝛽𝑝 𝑥𝑖 𝑛 + 𝜀 この時の𝛽2 が推定された因果効果とみなせる どの程度フィッティングしたら良いかについてはモデル 比較を通じて分析者が決める必要がある。 割当変数 結果 変数 線形性を仮定した 場合の因果効果 多項式を利用した 場合の因果効果 22
  16. © GO Inc. • 多項式を導入することで非線形な関係を表現し因果効果を推定することが可能になる • しかし多項式を導入することによる別のバイアスが発生する場合がある ◦ gelman and

    imbens 2019 多項式を導入することによる弊害 https://sites.stat.columbia.edu/gelman/research/published/2018_gelman_jbes.pdf Noisy estimates (ノイズの多い推定値) Sensitivity to the degree of the polynomial (多項式の次数に対する感度) Inferences that do not achieve nominal coverage (信頼区間のカバー率が低い) 高次の多項式は閾値から離れたデータ点の影響を強く受け推 定値を不安定にし結果的に推定の精度を悪化させる事がある。 多項式の次数を少し変えただけで結果が大きく変わる多項式 回帰モデルの脆弱性がある。結果の信頼性に関わる影響が考 えられる。 RDD分析では高次の多項式を使えば閾値から離れたデータ点 の影響を強く受け、局所的な介入効果の推定を歪め、信頼区 間の妥当性を損なう傾向がある 23
  17. © GO Inc. • 非線形を仮定する場合は閾値付近のデータのみを利用することが推奨されている • 閾値付近のデータの局所平均か局所回帰分析による因果効果の推定ができる Sharp RDD (ノンパラメトリック)

    局所平均 設定したバンド幅に含まれる閾値付近の介入サンプ ルと非介入サンプルの平均値の差分を集計する 局所回帰分析 設定したバンド幅に含まれる閾値付近のサンプルに 対して局所線形回帰を実施し因果効果を推定する バンド幅(h) バンド幅(h) ノンパラメトリック推定方法により、柔軟な推定を行う事ができる。 一方でバンド幅の設定によっては得られる因果効果にバイアスが混じる可能性があり、 バンド幅内のサンプルのみを利用するためサンプルサイズが小さくなり分散が大きくなる。 最適なバンド幅を決定するための手法 : G. Imbens and Kalyanaraman 2011; Calonico, Cattaneo, and Titiunik 2014 https://scholar.harvard.edu/files/imbens/files/rd_09feb3.pdf 24
  18. © GO Inc. • FuzzyRDDは操作変数法を利用して因果効果を推定する事ができる • 非連続な変化に対して介入の割当確率の逆数を合わせる事で介入効果を推定する Fuzzy RDD 介入時の潜在結果

    非介入時の潜在結果 介入の割当確率 Sharp RDDで推定さ れる因果効果 本来推定したい因果効果 (介入の割当確率で重み付けしバイアスを除去する) 𝜏 = lim 𝑥→𝑐0 𝐸 𝑌 𝑋 = 𝐶0 − lim 𝑐0⟵𝑥 𝐸 𝑌 𝑋 = 𝐶0 lim 𝑥→𝑐0 𝐸 𝑇 𝑋 = 𝐶0 − lim 𝑐0⟵𝑥 𝐸 𝑇 𝑋 = 𝐶0 この𝜏を推定するには2段階最小二乗法を利用する 1 𝑡𝑖 = 𝛽0 𝑥𝑖 + 𝛽1 𝑥𝑖 ≥ 𝑐0 + 𝜖𝑖 2 𝑦𝑖 = 𝜏𝑡𝑖 + 𝛽1 𝑥𝑖 + 𝜖𝑖 (2)で得られた 𝜏 の推定量が因果効果となる 25
  19. © GO Inc. • 得られた因果効果が妥当なものかを判断するにあたって検証をする必要がある • どれかの検証で望まない結果が出た場合は再度実験計画を立てる必要がある 事前検証 McCrary検定 Placebo

    outcomes 閾値の付近で割当変数に連続性があるかどうかを 確認する方法。連続性が見られない場合何かしら のバイアスが発生している可能性がある 割当変数以外で結果に影響を与えると考えられる 変数に対してRDDによる因果効果の推定を行い、 影響がないことを確認する https://www.sciencedirect.com/science/article/pii/S0304407607001133 https://www.sciencedirect.com/science/article/pii/S0304407607001133 26
  20. © GO Inc. • RDDを元に派生した手法がいくつか存在する • 得られているデータや検証したいことに合わせて手法を選択する必要がある RDDから派生した手法 Multiple Cut

    off RDD Hierarchical RDD Difference-in-Discontinuities Geographic RDD 割当変数に対して閾値が複数存在する場合の 因果効果を算出する手法 RDDの因果効果推定に階層構造を持たせた手法 グループ間での因果効果を算出する際に有効となる。 閾値周辺での介入効果の変化に介入前後の時間的な変化と 合わせて因果効果を推定する際に有効 地理的な境界線を閾値として、その境界を挟んで介入を 受ける、受けないが決まる際に有効 https://docs.iza.org/dp15051.pdf https://arxiv.org/pdf/2309.01404 https://arxiv.org/html/2405.18531v1 https://rdpackages.github.io/referenc es/Keele-Titiunik_2015_PA.pdf 27
  21. © GO Inc. • 因果推論により因果効果を推定する方法について • RDD手法の必要性とSharpRDD/FuzzyRDDの種類について • SharpRDDを利用した場合の因果効果の推論方法について •

    FuzzyRDDを利用した場合の因果効果の推論方法について まとめ 参考資料 : ・Causal Inference MixTape https://mixtape.scunning.com/06-regression_discontinuity#the-fuzzy-rd-design ・ Pythonで因果推論(8)~回帰不連続デザイン(RDD)を用いた効果検証~ https://zenn.dev/s1ok69oo/articles/f40ca93fe31a8d#ファジーな回帰不連続デザインによる効果検証 ・関西大学 方法論特殊講義Ⅲ 回帰不連続デザイン https://www.jaysong.net/kobe-ci/material/rdd.html ・A Practical Guide to Regression Discontinuity https://www.mdrc.org/sites/default/files/regression_discontinuity_full.pdf 29