Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Synthetic Control Method(合成コントロール法)1

MasaKat0
January 31, 2023

Synthetic Control Method(合成コントロール法)1

第1回:標準的な合成コントロール法とその仮定.

MasaKat0

January 31, 2023
Tweet

More Decks by MasaKat0

Other Decks in Research

Transcript

  1. Synthetic Control Method (SCM; 合成コントロール法) nAthey and Imbens (2017): •

    “the simplicity of the idea, and the obvious improvement over the standard methods, have made this a widely used method in the short period of time since its inception.” • “arguably the most important innovation in the policy evaluation literature in the last 15 years.” 2
  2. 因果推論の分類 n因果推論の手法や枠組みは大きく以下の要素などに分解される. やや教えるための独自見解(Mixtapeとかの雰囲気?) • 推定対象(Estimand):何を因果効果として推定するか.Ex. 平均処置効果. • 統計モデル:因果効果を含む変数間の関係を表すモデル.Ex. 線形回帰モデル •

    識別戦略:因果効果や統計モデルのパラメータの識別方法.Ex. 操作変数法. • 推定方法:因果効果や統計モデルの推定方法.Ex. 最小二乗法,IPW推定量. • 推論・予測:統計的推論・予測・意思決定の方法.Ex. 仮説検定. 8
  3. 差分の差法 n因果効果(処置効果)= 𝑌"%&' − 𝑌"#$? Ø時間に依存するトレンドが存在する場合,この推定量は因果効果を表さない. nそこで,以下の条件を満たす対照群を見つける. • 処置の効果を受けない. •

    処置の影響を受ける処置ユニットと同じトレンドを有する(平行トレンドの仮定). n対照群の処置前のアウトカムを𝑊"#$,処置後のアウトカムを𝑊"%&'とする. n処置の影響を受けていないトレンド= 𝑊"%&' − 𝑊"#$. 12
  4. 差分の差法 n差分の差法における因果効果= 𝑌"%&' − 𝑌"#$ − (𝑊"%&' − 𝑊"#$) nこの因果効果は処置群上の平均処置効果(ATT)と呼ばれる.

    13 処置 ユニット 処置𝑇! 𝑌"#$ 時間 アウトカム 𝑌"%&' 𝑊"#$ 𝑊"%&' 非処置 ユニット 平行トレンド 反実仮想的な処置を 受けなかった時の𝑌"%&' 処置効果
  5. 差分の差法と合成コントロール法 n差分の差法と合成コントロール法は密接に関連(Arkhangelsky et al. (2021)). • 共通の問題意識:観測できない比較事例を代替する. • 応用事例・仮定している状況は異なる. n差分の差法:処置に曝されるユニットの数が多く,「平行トレンド」を仮定できる.

    n合成コントロール法:単一の(あるいは少数の)ユニットが処置に曝される環境を 想定.ユニットを処置に曝される前のトレンドに合わせて,処置されていないユ ニットの加重和を用いることで,平行トレンドの欠如を補う. 18
  6. 合成コントロール法 n𝐽 + 1個のユニット1,2, . . , 𝐽 + 1と時間1,2,

    … , 𝑇が存在. nユニット1はある時点𝑇! において処置に曝される. n時点𝑡における, • ユニット𝑗の処置に曝されない場合の(潜在)アウトカムと𝑌 +' ,する. • 時点𝑡 > 𝑇! における処置ユニット1のアウトカムを𝑌-' . とする. • 時点𝑡 > 𝑇! において𝑌-' ,は観測できない. 21
  7. 合成コントロール法 nある時点𝑡におけるユニット𝑗の観測されるアウトカムを𝑌 +' とする. • 𝑗 = 1(処置ユニット):𝑡 ≤ 𝑇!

    において𝑌-' = 𝑌-' ,, 𝑡 > 𝑇! において𝑌-' = 𝑌-' . • 𝑗 = 2, … , 𝐽 + 1(非処置ユニット):全ての𝑡において𝑌 +' = 𝑌+' ,. nある時点𝑡 > 𝑇! における処置にユニットに対する処置効果: 𝜏-' = 𝑌-' . − 𝑌-' , n𝑌-' ,を観測することはできないので,推定量4 𝑌-' ,で置き換える必要がある. 22
  8. 合成コントロール法 nある適当な重み𝑤+ ∗を用いて, 𝑌-' ,の推定量4 𝑌-' ,を以下のように構築する: 4 𝑌-' ,

    = 6 +01 23- 𝑤+ ∗𝑌 +' = 6 +01 23- 𝑤+ ∗𝑌 +' , . 説明の都合上,推定量ではあるが真値𝑤! ∗を用いている, " 𝑌#$ %を𝑌 !$ の線型結合で推定(予測)することを伝えたい. データ生成過程は論文によって異なる.かならずしも𝑌#$ %の期待値が𝑌 !$ の期待値の線型結合であるわけではない? nそして処置効果𝜏-' の推定量を ̂ 𝜏-' = 𝑌-' . − 4 𝑌-' ,とする. n適当な重み𝑤+ ∗は最小二乗法などによる推定量で置き換える.例えば, 8 𝑤1, … , 8 𝑤23- 4 = arg min 5$,…,5%&' ( ∈ℝ% 6 '0- :);- 𝑌-' − 6 +01 23- 𝑤+𝑌 +' 1 . 23
  9. 合成コントロール法の課題と対策 n合成コントロール法はただのパネルデータを用いる(線形)回帰. • それだけなら通常の回帰の手法を用いれば良い. n応用上,しばしば想定される「非処置ユニット数が大きくて,時系列が短い」問題. • 最小二乗法 min 5$,…,5%&' (

    ∈ℝ% ∑ '0- :);- 𝑌-' − ∑ +01 23- 𝑤+ 𝑌 +' 1 を再考する. nユニット数(次元数)𝐽が大きく,時系列の長さ(サンプルサイズ)𝑇! が短い場合. → 推定量8 𝑤1, … , 8 𝑤23- の振る舞いが不安定になる. 25
  10. 合成コントロール法の課題と対策 n「ユニット数(𝐽)が大きくて,時系列(𝑇! )が短い」問題への対策. nAbadie and Gardeazabal (2003),Abadie, Diamond, and Hainmueller

    (2010). • 合成コントロール法を(「初めて」)明示的に提案した研究. • その意味で「標準的な」合成コントロール法. • 制約付き最小二乗法でパラメータを推定. • 推論にはフィッシャーの正確検定などを用いる. 26
  11. 合成コントロール法の課題と対策 n「ユニット数が大きくて,時系列が短い」問題は高次元モデルの推定と似ている, nスパース性を仮定して,Lasso回帰・Ridge回帰・Elastic netなどを適用. • Ben-Michael, Feller, and Rothstein (2018):

    Ridge回帰(拡張合成コントロール法). • Carvalho, Masini, and Medeiros (2018): Lasso回帰. • Doudchenko and Imbens (2016): Elastic net. • 推論にはブートストラップ法(conformal predictionを含む)などを用いる. 27
  12. 「標準的な」合成コントロール法 nAbadie and Gardeazabal (2003) ・Abadie, Diamond, and Hainmueller (2010).

    • もっとも「標準的な」合成コントロール法. • 制約付き最小二乗法により重みを推定. 8 𝑤1, … , 8 𝑤23- 4 = arg min 5$,…,5%&' ( ∈ℝ% 6 '0- :);- 𝑌-' − 6 +01 23- 𝑤+𝑌 +' 1 s. t. 𝑤+ ≥ 0 ∀𝑗 and 6 +01 23- 𝑤+ = 1. n最小二乗法の解を安定させるためや解釈性のための制約.重みは比率. 29
  13. 「標準的な」合成コントロール法 ØAbadie and Gardeazabal (2003):バスク地方におけるテロの影響を評価. nETA(テロ組織)によるバスク地方でのテロ. • 1968年から1990年代の半ば. • 目的:資金調達

    → ターゲットは起業家. → 起業家がバスク地方から逃げる. • 結果の予想:バスク地方の1人当たりGDPが低下. nスペインの他の州を用いて合成ユニットを作成. 30
  14. 「標準的な」合成コントロール法 プラシーボ研究 n疑問. • 図の実際のGDPと反実仮想のGDPの差が本当にテロの影響なのか? • テロがない場合のバスク地方の成長経路を再現できなかった誤差なのか? n 「プラシーボ研究」でこの疑問を解決する. •

    バスク地方に用いた方法を「非テロ地域」(バスク以外の地域)に適用. • バスク地方と似ているが,テロ活動が活発でない地域の経済発展を,同じくテロ 活動が活発でない合成ユニットの経済発展と比較する. 31
  15. 「標準的な」合成コントロール法 nAbadie, Diamond, and Hainmueller (2010):カリフォルニア州におけるタバコ規制 であるProposition 99のタバコ年間売上高への影響. 34 カリフォルニア州と他州との比較.Proposition

    99を施行していない他州でも タバコの年間売上高は減少傾向. 合成コントロール法を用いて,処置ユニット(カリフォルニア州)がProposition 99 を施行しなかった場合の反実仮想的なアウトカムを予測.
  16. Doudchenko and Imbens (2016) n制約はなくてもいい?→ 推定量が安定すればいい. nDoudchenko and Imbens (2016):LassoやRidge回帰の使用を提案.

    • Elastic net型の目的関数. 切片項𝜇も追加する. ! 𝑤!, … , ! 𝑤"#$ % = arg min &!,…,&"#$ % ∈ℝ" , +,$ -&.$ 𝑌$+ − 𝜇 − , /,! "#$ 𝑤/𝑌 /+ ! + 𝜆 ⋅ 1 − 𝛼 2 𝒘 ! ! + 𝛼 𝒘 . nこうした推定量が各種提案されてきた. 35
  17. 拡張合成コントロール法 nBen-Michael, Feller, and Rothstein (2018)によるRidge回帰的な方法. • 各ユニット𝑗が処置されなかった場合のアウトカムのデータ生成過程: 𝑌 +'

    , = 𝑚+' + 𝜀+' . 𝜀+' はsubgassian (0, 𝜎). • 𝑚+' の推定量を 8 𝑚+' とする. 8 𝑚+' は過去の𝑌 +' ,から作られる(時系列?). • Ridge回帰を用いることを提案.モデルは線形モデルとlatent factorモデルの二つを検証. n𝑌:) ,を予測する問題を考える. n拡張合成コントロール推定量:4 𝑌-:) ,,<=> = ∑ +01 23- 8 𝑤+𝑌 +:) + 8 𝑚-:) − ∑ +01 23- 8 𝑤+ 8 𝑚+:) . 36
  18. 拡張合成コントロール法 n 8 𝑚+' が線形モデルであるとする.つまり, 8 𝑚+' = ̂ 𝜂!

    + ∑ '0- :);- ̂ 𝜂'𝑌 +' 4. nパラメータはRidge回帰で推定する.つまり, ̂ 𝜂0 12345, ! 𝜼12345 = arg min 6&,𝜼, 6' ' 1 2 , /,! "#$ 𝑌 /-& − 𝜂0 + , +,$ -&.$ 𝜂+𝑌 /+ % ! + 𝜆12345 𝜼 ! !. nRidge回帰の解析解を代入すると,拡張合成コントロール推定量は, ; 𝑌$-& 894 0 = , /,! "#$ = 𝛾/ 894𝑌 /-& . 37
  19. 拡張合成コントロール法 n 計算のために変数を新しく定義する. 𝑈0⋅ = 𝑌$$ ⋯ 𝑌$-& , 𝑈$⋅

    = 𝑌!$ ⋯ 𝑌!(-&.$) ⋮ ⋮ ⋮ 𝑌("&#$)$ ⋯ 𝑌("&#$)(-&.$) . n すると,= 𝛾= 894 = = 𝛾= >?@ + 𝑈$⋅ − 𝑈0⋅ % = 𝛾>?@ % 𝑈0⋅ %𝑈0⋅ + 𝜆A=BCD𝐼-& .$ . n これと同値の定式化は以下のようになる: min 𝒘 F.+.∑ ()! "#$ &(,$ 1 2𝜆12345 , +,$ -&.$ 𝑌$-& − , /,! "#$ 𝑤/𝑌 /+ ! + 1 2 𝒘 ! !. n 推論はConformal inferenceで行う. 38
  20. 推論 n処置効果𝜏の推定量は ̂ 𝜏-' = 𝑌-' . − 4 𝑌-'

    ,. Ø帰無仮説𝐻! : 𝜏 = 𝜏! (例えば,𝜏! = 0で効果なし). n「ユニット数が大きくて,時系列が短い」→漸近論が使えない. nAbadieはフィッシャーの正確確率検定のような検定方法を慰安. nLassoなど高次元統計の手法を用いる場合でも検定可能. • Conformal inference. 40
  21. 推論:Abadie et al. (2003, 2010)とAbadie et al. (2015) nAbadie et

    al. (2003, 2010)とAbadie et al. (2015). • どちらも基本的な考え方はフィッシャーの正確確率検定に近い. nFirpo and Possebom (2017)に詳細な説明. nAbadie et al. (2003, 2010):プラシーボ研究を(そのまま)検定に利用. • 数学的な操作はあまりしていない(?).よく分からなかった(調査中). 42
  22. 推論:Abadie et al. (2015) n想定している状況. • ある𝑡 ∈ {𝑇! +

    1, … , 𝑇}において R 𝛼+' が非常に大きい. • 他の期ではそこまで大きくない. • Abadie et al. (2003, 2010)のような,プラシーボ研究では判断できない. np値を計算して,帰無仮説を棄却するかどうかを判断する. 43
  23. 推論:Abadie et al. (2015) 1. 非処置データに合成コントール法を繰り返し適用.プラセボ効果の分布を得る. 2. それぞれのプラセボについて介入前の期間についてRMSPEを計算する. RMSPE=平均二乗予測誤差の平方根. 3.

    それぞれのプラセボについて介入後の期間についてRMSPEを計算する. 4. 介入後と介入前のRMSPEの比を計算する. 5. この比を降順に並べる. 6. 介入群のユニットの分布における比率を計算する. 44
  24. 推論:Abadie et al. (2015) n𝑗 ∈ {1,2, … , 𝐽

    + 1}に対して, 𝑅𝑀𝑆𝐸+ = ∑'0:)3- : 𝑌 +' − 4 𝑌 +' , /(𝑇 − 𝑇! ) ∑'0:)3- : 𝑌 +' − 4 𝑌 +' , /𝑇! . np値を以下のように計算する: 𝑝 ≔ ∑ +01 23- 1[𝑅𝑀𝑆𝐸+ ≥ 𝑅𝑀𝑆𝐸-] 𝐽 + 1 . 45
  25. 推論:Conformal inference n Conformal inference • 2005年ごろから発展してきた,予測のための推論を行うブートストラップ法の一種. • Chernozhukov, Feng,

    and Titiunik (2019):合成コントロール法における使用を提案. • Chernozhukov, Wüthrich, and Zhu (2018):Conformal inferenceそのものに対する理論解析. https://www.youtube.com/watch?v=Wcm9Uw0YL8A&t=60s n その他,参考になる資料: • https://matheusfacure.github.io/python-causality-handbook/Conformal-Inference-for-Synthetic-Control.html • Shafer and Vovk (2007) “A Tutorial on Conformal Prediction” (JMLR). Lei et al. (2017) “Distribution-Free Predictive Inference For Regression” • Ben-Michael, Feller, and Rothstein (2018). 46
  26. 推論:Conformal inference n三段階からなる推論. 1. 「強い」帰無仮説𝐻! : 𝜏 = 𝜏! のもとで,処置ユニットの調整された処置後アウト

    カム ] 𝑌-' = 𝑌-' − 𝜏! を作成し,データセットに追加する. 2. ] 𝑌-' を予測する合成ユニットを,𝑇までのデータを全部用いて,合成コントロー ル法を用いて作成する. その重みを8 𝑤+' (𝜏! )とする. 3. 調整後の処置後のアウトカムに対する残差] 𝑌-' − ∑ +01 23- 8 𝑤+'(𝜏!)𝑌 +' が,処置前 のアウトカムと「conformal(適合的)」であるかどうかのp値を計算する. 47
  27. 推論:Conformal inference nアイデア. • 分布に対して仮定を置くことなく,信頼区間を得ることができる. • 「強い」帰無仮説𝐻! : 𝜏 =

    𝜏! を考える. • 処置効果は 𝜏! と仮定されているので,その仮定のもとで,処置されたユニットの, 処置後の,処置されなかった場合のアウトカムを4 𝑌 +' , = 𝑌 +' . − 𝜏! と推定. • そのデータを使って予測モデルを構築. • その予測モデルとデータが適合的(conformal)かどうかを調べる. 48
  28. Ferman and Pinto (2021) Synthetic controls with imperfect pretreatment fit

    n「標準的な」合成コントロール法:回帰が完璧(後で定義)であることを仮定. • しかし,実際にはそうでないことがある=モデルが反実仮想を予測できない. • 予測(当てはまり)が悪い場合,なんらかの意味でバイアスが生じる. • 合成コントロール法が暗黙的に置いていた仮定を明らかにした研究. 51
  29. Ferman and Pinto (2021) 因子モデル n潜在アウトカム: 𝑌 +' , =

    𝑐+ + 𝛿' + 𝜆' 𝛾+ + 𝜖+' , 𝑌 +' . = 𝜏+' + 𝑦+' ,. • ここで,𝛿+ はユニット間で等しい未観測共通因子,𝑐/ は未知の時間不変な固定効果,𝜆+ は未観 測共通因子の(1×𝐹)ベクトル,𝛾/ は(𝐹×1)ベクトルの未知の因子負荷量,誤差項𝜖/+ は未観測の 時間・ユニット固有のショック. • 𝑐/, 𝛾/ /,0 " は固定されており, 𝜆+ +,$ - , 𝛿+ +,$ - , 𝜖/+ +,$ - は確率的とする. • 𝔼 𝜖/+ = 0. 52
  30. Ferman and Pinto (2021) 従来の合成コントロール法 Ø今までの合成コントロール法が考えていた状況. n 以下の集合を考える. K Φ

    = 𝑤!, … , 𝑤"#$ % ∈ ℝ"| , /,! "#$ 𝑤/ = 1, 𝛾0 = , /,! "#$ 𝛾/𝑤/ , 𝑐0 = , /,! "#$ 𝑐/𝑤/ . n K Φが空でないとき,その要素𝑤∗を用いて実行不可能な合成コントロール推定量 ̂ 𝜏$+ ∗ = 𝑌$+ − , /,! "#$ 𝑌 /+𝑤∗ = 𝜏$+ + 𝜖$+ − , /,! "#$ 𝜖/+𝑤∗ を考えることができる.これは不偏(バイアスがない)推定量(𝔼 ̂ 𝜏$+ ∗ = 𝜏$+ ). n Abadie, Diamond, and Haimueller (2010)はこうした? Φに対する仮定をしていない. • 代わりに,𝑌(' = ∑ )*+ ,-( 𝑤∗𝑌 )' となる重み𝑤∗の存在を仮定=「完璧な処置前の適合」. 53
  31. Ferman and Pinto (2021) モデル誤特定 n現実に実行できる合成コントロール法の推定量を8 𝑤+ DEとする. n未観測共通因子𝜆' と誤差項𝜖+'

    の両方に系列相関を許容する. nこのとき,合成コントロール推定量は,𝑇! → ∞において, ̂ 𝜏$+ JK = 𝑌$+ − , /,! "#$ ! 𝑤/ JK𝑌 /+ → L 𝜏$+ + 𝜆+ 𝛾$ − , /,! "#$ 𝛾/ ! 𝑤/ JK + 𝑐$ − , /,! "#$ 𝑐/ ! 𝑤/ JK + 𝜖$+ − , /,! "#$ 𝜖/ ! 𝑤/ JK . • ここで, 𝛾- ≠ ∑ +01 23- 𝛾+ 8 𝑤+ DE,かつ,𝑐! ≠ ∑ +01 23- 𝑐+ 8 𝑤+ DE. • これはバイアスがある推定量(𝔼 ̂ 𝜏-' ≠ 𝜏-' )をもたらす. 54
  32. Ferman and Pinto (2021) 差分の差推定量 n固定効果𝑐+ と𝛿' が,ユニット・時間平均で表される場合(平行トレンド). nこのとき,差分の差法による処置効果の推定量は,𝑡 ∈

    {𝑇!, … , 𝑇}に対して, ̂ 𝜏$+ MNM = 𝑌$+ − 1 𝐽 − 1 , /,! "#$ 𝑌 /+ − 1 𝑇0 − 1 , F,$ -&.$ 𝑌$F − 1 𝐽 − 1 , /,! "#$ 𝑌 /F → L 𝜏$+ + 𝜆+ 𝛾0 − 1 𝐽 − 1 , /,! "#$ 𝛾/ + 𝜖$+ − 1 𝐽 − 1 , /,! "#$ 𝜖/+ 𝑎𝑠 𝑇0 → ∞. • 𝔼 𝜆' = 0であるならば不偏推定量. Ø平行トレンドの仮定が成立していない場合にはバイアスがある. 55
  33. Ferman and Pinto (2021) 平均が引かれた合成コントロール推定量 n差分の差法と合成コントロール法を組み合わせた推定量を考える: ! 𝑤MJK = arg

    min 𝒘 F.+.∑ ()! "#$ &(,$ , +,$ -&.$ 𝑌$+ − , /,! "#$ 𝑤/𝑌 /+ − 1 𝑇0 − 1 , +,$ -&.$ 𝑌$+ − , /,! "#$ 𝑤/ 1 𝑇0 − 1 , +,$ -&.$ 𝑌 /+ ! . • 事前に平均 - 2;- ∑ +01 2;- 𝑌 +' を𝑌 +' から引く(Demeaned SCM (DSCM)推定量). nΦ = 𝑤1 , … , 𝑤23- 4 ∈ ℝ2| ∑ +01 23- 𝑤+ = 1, 𝛾- = ∑ +01 23- 𝛾+ 𝑤+ に対して, ̂ 𝜏$+ MJK = 𝑌$+ − , /,! "#$ ! 𝑤/ MJK𝑌 /+ → L 𝜏$+ + 𝜆+ 𝛾$ − , /,! "#$ 𝛾/ ! 𝑤/ MJK + 𝜖$+ − , /,! "#$ 𝜖/ ! 𝑤/ MJK . 56
  34. Ferman and Pinto (2021) 平均が引かれた合成コントロール推定量 nユニットごとの固定効果が存在していても, 𝛾- = ∑ +01

    23- 𝛾+ 8 𝑤+ DEなら不偏. • 𝑐! ≠ ∑ +01 23- 𝑐+ 8 𝑤+ DEを許容する. n適当な仮定のもとで,DSCMの平均二乗誤差(MSE)は,DIDのMSEを下回る. nConformal inferenceに基づく仮説検定も提案. 57
  35. Shi, Sridhar, Misra, and Blei (2022) On the Assumptions of

    Synthetic Control Methods Ø合成コントロール法は因果効果を推定できているのか? n線形性の仮定は妥当か? n処置ユニットと未処置ユニットを構成するより細かいユニットに着目. → 因果効果を推定するための十分条件を導出. n従来の合成コントロール法の分析単位は州や国などの大きな単位. nそれらを構成するきめ細かな(fine-grained)単位に着目. • 従来の合成コントロール法のユニットは,より細かなユニットのグループ. 59
  36. Shi, Sridhar, Misra, and Blei (2022) On the Assumptions of

    Synthetic Control Methods nあるユニット𝑗を,きめ細かな単位𝑖からなるグループであるとする. n処置を受ける/受けなかった場合の潜在アウトカムを 𝑌F+' . , 𝑌F+' , とする. n潜在アウトカムに影響を及ぼす未観測変数を𝑍F+' ∈ ℝGとする. n𝑌と𝑍の関係は,線形でも非線形でもよく,時間によって変化可能. 60 𝑌/(' 0 𝑌/(' 0 𝑌/(' 0 𝑌/+' 0 𝑌/+' 0 𝑌/+' 0 𝑌/1' 0 𝑌/1' 0 𝑌/1' 0 𝑗 = 1 𝑗 = 2 𝑗 = 3 𝑌(' 0 𝑌+' 0 𝑌1' 0 従来の仮定 新しい仮定
  37. Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 nここで,小ユニット𝑖について推論し,各グループ𝑗を小ユニットの分布として扱う. n小ユニットレベルの潜在アウトカム(𝑌F+'

    , )のデータ生成過程 • 明示的なパラメトリックな仮定をしない. • 𝑌F+' , と𝑍F+' はノンパラメトリック.かつ, 𝑍F+' は未観測. nそれでも,グループ単位で線形性が成立する方法を示す. → 合成コントロール法を実行できる. 61
  38. Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 n因果効果の識別につながる不変性の仮定について述べる. Ø第一の仮定:独立した因果メカニズム(ICM).

    • 原因𝑍(すなわちその「メカニズム」)を与えられた各変数の条件分布は,他の条 件分布に情報を与えず,影響を与えないという原則(Schölkopf et al.,2012). n仮定A1(ICM). • 原因𝑍の条件付きで,潜在アウトカム𝑌,は母集団分布𝑗に依存しない. • 時刻𝑡 ≤ 𝑇における母集団分布jに対して,𝑌,と𝑍の結合分布は以下の通り: 𝑃+' 𝑍, 𝑌, = 𝑃+' 𝑍 𝑃' 𝑌, 𝑍 . 62
  39. Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 nこの仮定は,個々の原因𝑍の分布はグループと時間の間で変化しうるが,条件 付きアウトカム𝑌,|𝑍は時間によってのみ変化する,というもの.

    n各時点𝑡について,個人の潜在的原因𝑍をすべて知っているかどうかは,そのコ ントロール潜在アウトカムの分布についての追加情報を与えない. n上式を用いて、期待反実仮想アウトカムは次のようになる: 𝔼' 𝑌 +' , = 6 L 𝔼' 𝑌, 𝑍 = 𝑧 𝑃+'(𝑍 = 𝑧) • ここで,𝔼' は𝑃'(𝑌,|𝑍 = 𝑧)に関する期待値を表し,グループ間で不変. 63
  40. Shi, Sridhar, Misra, and Blei (2022) ファクターモデルとの比較 nグループ・レベルのファクターモデル(Ferman and Pintoモデルの固定効果𝑐!

    と𝜆$ をゼロ): 𝑌 +' , = 𝜆' 𝛾+ + 𝜖+' , 𝑌 +' . = 𝜏+' + 𝑦+' ,. • 𝔼 𝑌 +' , = ∑L 𝔼' 𝑌, 𝑍 = 𝑧 𝑃+'(𝑍 = 𝑧)はファクターモデルと似ている. • ファクターモデルのベクトル𝜆' は条件付き期待アウトカムのベクトルと解釈. • 原因𝑍F+' と潜在的な結果𝑌F+' , の間の関係については,何も仮定していない. n式𝔼 𝑌 +' , = ∑L 𝔼' 𝑌, 𝑍 = 𝑧 𝑃+'(𝑍 = 𝑧)の線形性 ↑グループ・レベルのアウトカムは小ユニットレベルのアウトカムの平均. 64
  41. Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 n 第2の仮定:安定分布.原因𝑍を二つの原因に分解できるとする.

    • 1. 処置ユニットと未処置ユニットで異なる原因.2. 処置ユニットと未処置ユニットで不変の原因. n 仮定A2:原因を2つの部分集合𝑍={𝑈, 𝑆}に分解する. • 処置ユニットと未処置ユニットを区別する部分集合を𝑆とする. = 処置グループにおける分布は,未処置グループにおけるその分布と異なる. • すべてのグループにおいて,𝑆の分布はすべての時間𝑡 ≦ 𝑇で変化しない. 𝑃/+ 𝑍 = 𝑃/ 𝑆 𝑃+ 𝑈 𝑆 . n 部分集合𝑆は,グループによって異なるが,時間に対して不変な原因を含む. n 𝑈の条件付き分布は,時間によって変化するが,グループに対して不変. n 𝑆を最小不変集合と呼ぶ. 65
  42. Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 n ICMと安定分布より,𝔼

    𝑌 /+ O = ∑(P,F) 𝔼+ 𝑌O 𝑈 = 𝑢, 𝑆 = 𝑠 𝑃+(𝑈|𝑆)𝑃/(𝑆 = 𝑠). • ここで,𝑢に対して先に和を計算すると,期待アウトカムは. 𝔼 𝑌 /+ O = , F 𝔼+ 𝑌O 𝑆 = 𝑠 Q' 𝑃/(𝑆 = 𝑠) R( n 上式とファクター・モデル𝑌 /+ O = 𝜆+𝛾/ + 𝜖/+ を比較する. • 𝔼+ 𝑌O 𝑆 = 𝑠 ≈ 𝜆+ と𝑃/ 𝑆 = 𝑠 ≈ 𝛾/ . n ファクター・モデルは不変性仮定と安定性仮定に由来. 66
  43. Shi, Sridhar, Misra, and Blei (2022) 因果効果の識別可能性 n 追加で以下の仮定を置く. n

    仮定A3 (十分に類似した未処置グループ). • 合成コントロールを構築するために使用する未処置グループの集合を𝐷とする. • 処置グループと未処置グループの最小不変集合を𝑆とする. • 未処置グループの基数(cardinality)が最小不変量集合の基数以上であれば,未処置グループ は十分に類似していると言える: 𝐷 ≥ 𝑆 . n 仮定A4 (対象ドナーの重複). • {𝑠$ , … , 𝑠A }を𝑆のサポートとする. • それぞれの𝑠に,未処置グループ集合𝐷に少なくとも一つグループ𝑗が存在し,𝑃/ 𝑆 = 𝑠 > 0. 67
  44. Shi, Sridhar, Misra, and Blei (2022) 因果効果の識別可能性 n 定理1.(因果効果の識別可能性) •

    因果的メカニズムが独立(仮定A1). • 処置ユニットと未処置ユニットは安定(仮定A2). • 選ばれたドナーは互いに十分に似ている(仮定A3). • 処置ユニットと未処置ユニットの間に重複がある(仮定A4). • 重みの集合 𝛽/ /∈["] が存在し,すべての期間にわたって,処置ユニットの反実仮想は,未処置 ユニットのアウトカムの重み付き和として書ける: 𝔼 𝑌0+ O = , /∈["] 𝛽/𝔼[𝑌 /+ O] . 68
  45. Shi, Sridhar, Misra, and Blei (2022) 因果効果の識別可能性 n 小ユニット(個人)レベルの潜在アウトカムに対して仮定を置いた. •

    グループ内の小ユニット(個人)にはパラメトリックな仮定をしていない. n それでも,グループのアウトカムに対する線形性を得られる: 𝔼 𝑌0+ O = , /∈["] 𝛽/𝔼[𝑌 /+ O] → グループ内の小ユニット(個人)のアウトカムは𝑍に対して非線形でも良い. 69
  46. Shi, Sridhar, Misra, and Blei (2022) 示唆1:グループの種類の混在 Øグループの種類の混在 • 何がユニットとして扱われうるか.

    n 古典的な合成コントロール法:州など,同じ種類の集合をグループとして扱う. • Fine-grainedモデルは,各グループが個人のグループであればよい. • ターゲットと同じ種類のグループである必要はない. n 各未処置グループの影響力:処置グループや他の未処置グループとの差異. • つまり,最小不変集合の基数(cardinality)に関係. 70
  47. Shi, Sridhar, Misra, and Blei (2022) 示唆2:非線形データ生成過程を用いた合成コントロール法 Ø非線形データ生成過程を用いた合成コントロール法. • これまでの研究:

    𝑌 /+ O = 𝜆+𝛾/ + 𝜖/+ のような線形因子モデルの仮定から始まる. • パラメトリックモデルの役割は,因果効果の識別のためなのか,統計的な必要性のためなのか, 表記上の便宜のためなのかは不明? • 真のメカニズムが線形であると仮定することは,非現実的な仮定となり得る. 71
  48. Shi, Sridhar, Misra, and Blei (2022) 示唆2:非線形データ生成過程を用いた合成コントロール法 n これに対して,Fine-Grainedなモデルを用いて,なぜ合成コントロール法では基本的に線形性が 妥当な仮定となり得るのかを説明.

    • 推定対象を部分グループの平均効果とした. • 合成コントロール法をグループ再重み付けアルゴリズムと見立てた. • 線形因子モデルが因果効果の識別可能性の不変性仮定を内包していること. • 線形因子モデルの線形性は期待値が線形演算子であることに起因することを明らかに. n 実用的な意味合い:グループに包含される小ユニット(個人)が非線形なメカニズムを含んでい ても,グループ単位で線形モデルのもとで,因果効果の識別が可能. 72
  49. Shi, Sridhar, Misra, and Blei (2022) 示唆3: 𝑆の役割と未処置グループとの関係 Ø𝑆の役割と未処置グループとの関係. •

    古典的な合成コントロール法では,潜在因子𝜆+ は固定で低ランクであると仮定(Abadie, 2019). • その結果,すべての未処置グループからの情報を利用したくなることがある. • 最小不変量集合𝑆は合成コントロールの構築に使われる未処置グループの集合によって決定. • 未処置グループの集合が異なると最小不変集合も異なり,素朴に追加的に未処置グループを 含めると合成コントロールが存在しなくなる可能性がある. • たくさん未処置グループを入れすぎるのはよくない. 73
  50. 補助的な共変量 n各処置ユニットを特徴づける共変量𝑋+' = (𝑋+'-, … , 𝑋+'(N;-))も入手可能. → 各ユニットごとに𝑍+' =

    𝑍+'-, … , 𝑍+'N = (𝑌 +', 𝑋+'-, … , 𝑋+'(N;-))を観測. nどのように共変量𝑋+' を用いて,合成コントロール法の重みを推定するのか. 75
  51. 制約付き重み付き最小二乗法 nAbadie and Gardeazabal (2003)は,適当な重み𝑣 = (𝑣- , … 𝑣N

    )を用いて, 8 𝑤1 (𝑣), … , 8 𝑤23- (𝑣) 4 = arg min 5$,…,5%&' ( ∈ℝ% 6 P0- N 𝑣P 1 𝑇 6 '0- :);- 𝑍-'P − 6 +01 23- 𝑤+ 𝑍+'P 1 s. t. 𝑤+ ≥ 0 ∀𝑗 and 6 +01 23- 𝑤+ = 1. として, 𝑤1 ∗, … , 𝑤23- ∗ を推定することを提案. • では,重み𝑣 = (𝑣- , … 𝑣N )はどうやって決めればいいのか. • なお,この重みの決め方次第で,合成コントロール法の結果が変わることも. 76
  52. 重みの決め方 nAbadie and Gardeazabal (2003)は,以下の方法を提案: R 𝑣- , … ,

    R 𝑣N 4 = arg min Q R',…,Q R, (∈ℝ, 1 𝑇 6 '0- :);- 𝑌-' − 6 +01 23- 8 𝑤+ (𝑣)𝑌 +' 1 . • つまり,関心のあるパラメータに対して,誤差を最小化するように𝑣を推定. 77
  53. 最適化. n 重み𝑣を = 𝑣$, … , = 𝑣U %

    = arg min V W$,…,V W3 %∈ℝ3 1 𝑇 , +,$ -&.$ 𝑌$+ − , /,! "#$ ! 𝑤/(𝑣)𝑌 /+ ! . として推定するためには,各𝑣ごとに, ! 𝑤!(𝑣), … , ! 𝑤"#$(𝑣) % = arg min &!,…,&"#$ % ∈ℝ" , X,$ U 𝑣X 1 𝑇 , +,$ -&.$ 𝑍$+ − , /,! "#$ 𝑤/𝑍/+ ! s. t. 𝑤/ ≥ 0 ∀𝑗 and , /,! "#$ 𝑤/ = 1. を解く必要がある.非凸最適化なので,グリッドサーチなどで頑張る. 78
  54. • Abadie, A. and Gardeazabal, J. The economic costs of

    conflict: A case study of the basque country. American Economic Review, 93(1):113–132, March 2003. • Abadie, A., Diamond, A., and Hainmueller, J. Synthetic control methods for comparative case studies: Estimating the effect of california’s tobacco control program. Journal of the American Statistical Association, 105(490):493– 505, 2010. • Abadie, A., Diamond, A., and Hainmueller, J. Comparative politics and the synthetic control method. American Journal of Political Science, 59(2):495–510, 2015. • Athey, S. and Imbens, G. W. The state of applied econometrics: Causality and policy evaluation. Journal of Economic Perspectives, 31(2):3–32, May 2017 • Ben-Michael, E., Feller, A., and Rothstein, J. The augmented synthetic control method. Journal of the American Statistical Association, 116(536):1789–1803, 2021. • Chernozhukov, V., Wüthrich, K., and Zhu, Y. Inference on average treatment effects in aggregate panel data settings. cemmap working paper, 2019. • Chernozhukov, V., Wüthrich, K., and Zhu, Y. An exact and robust conformal inference method for counterfactual and synthetic controls. Journal of the American Statistical Association, 116(536):1849–1864, 2021. • Cunningham, S. and Shah, M. Decriminalizing Indoor Prostitution: Implications for Sexual Violence and Public Health. The Review of Economic Studies, 85(3):1683– 1715, 12 2017. • Doudchenko, N. and Imbens, G. W. Balancing, regression, difference-in-differences and synthetic control methods: A synthesis. Working Paper 22791, National Bureau of Economic Research, October 2016. • Ferman, B. and Pinto, C. Synthetic controls with imperfect pretreatment fit. Quantitative Economics, 12(4):1197– 1221, 2021. • Vovk, V., Gammerman, A., and Shafer, G. Algorithmic Learning in a Random World. Springer-Verlag, 2005. • Shi, C., Sridhar, D., Misra, V., and Blei, D. On the assumptions of synthetic control methods. In Proceedings of The 25th International Conference on Artificial Intelligence and Statistics, volume 151 of Proceedings of Machine Learning Research, pp. 7163–7175. 80