Slide 1

Slide 1 text

Synthetic Control Method 合成コントロール法 第1回:標準的な合成コントロール法とその仮定 加藤真大

Slide 2

Slide 2 text

Synthetic Control Method (SCM; 合成コントロール法) nAthey and Imbens (2017): • “the simplicity of the idea, and the obvious improvement over the standard methods, have made this a widely used method in the short period of time since its inception.” • “arguably the most important innovation in the policy evaluation literature in the last 15 years.” 2

Slide 3

Slide 3 text

構成 n第1回:標準的な合成コントロール法とその仮定. n第2回:派生的手法. n第3回:ベイズ合成コントロール法. n第4回:因果インパクト(Causal impact). n第5回:その他の話題. 3

Slide 4

Slide 4 text

導入

Slide 5

Slide 5 text

Neyman-Rubin因果モデル nある実験ユニットに対する処置効果を考える. n処置に曝される場合と,曝されない場合の両方で,潜在的なアウトカムが存在. n潜在アウトカムの差がTreatment effect(処置効果). n実際に観測できるアウトカムは処置/非処置の場合のどちらかのみ. → 観測できなかったアウトカムの反実仮想的な推定が必要. nこの観測できなかった欠損値を補間することで処置効果を推定. 5

Slide 6

Slide 6 text

平均的な処置効果の推定 n反実仮想的な性質により,処置効果を直接知ることはできない. nそのため,平均的な処置効果に関心がもたれる場合がある. n複数の実験ユニットが無作為に割り当てられた処置群と対照群を考える. • 処置群ではすべてのユニットが処置を受ける. • 対照群ではすべてのユニットが処置を受けない. • 処置群と対照群において,それぞれアウトカムの平均を計算. nその差を平均処置効果として定義し,処置効果を表すものとして解釈する. 6

Slide 7

Slide 7 text

時系列データにおける処置効果推定 n時系列データにおける処置効果. n処置群と対照群の二つの群が存在しない状況を考える. 1. 処置群だけ存在する場合. 2. 処置を受けるユニットしか存在せず,そのユニットが単一もしくは少量の場合. n対照群の(平均)処置効果に相当するものをどのように推定するのかが問題. • 差分の差法や合成コントロール法共通の問題意識. 7

Slide 8

Slide 8 text

因果推論の分類 n因果推論の手法や枠組みは大きく以下の要素などに分解される. やや教えるための独自見解(Mixtapeとかの雰囲気?) • 推定対象(Estimand):何を因果効果として推定するか.Ex. 平均処置効果. • 統計モデル:因果効果を含む変数間の関係を表すモデル.Ex. 線形回帰モデル • 識別戦略:因果効果や統計モデルのパラメータの識別方法.Ex. 操作変数法. • 推定方法:因果効果や統計モデルの推定方法.Ex. 最小二乗法,IPW推定量. • 推論・予測:統計的推論・予測・意思決定の方法.Ex. 仮説検定. 8

Slide 9

Slide 9 text

合成コントロール法 n時系列上の因果推論における識別戦略. nこの問題設定に適した統計モデル・推定・推論手法なども議論. • 統計モデル:線形回帰モデル・ベイズ構造時系列モデル(Causal impact)など. • 推定:制約付き最小二乗法など. • 推論手法:正確検定・事後分布など. 9

Slide 10

Slide 10 text

合成コントロール法の基礎

Slide 11

Slide 11 text

差分の差法 nある時点𝑇! において,処置ユニットに処置が発生する状況を考える. n処置の前後時点のアウトカムを観測.処置前を𝑌"#$,処置後𝑌"%&'をとする. 説明の都合上,アウトカムを定数として扱う.期待値で議論するので,定数として考えても問題ない? 11 処置 ユニット 処置𝑇! 𝑌"#$ 時間 アウトカム 𝑌"%&'

Slide 12

Slide 12 text

差分の差法 n因果効果(処置効果)= 𝑌"%&' − 𝑌"#$? Ø時間に依存するトレンドが存在する場合,この推定量は因果効果を表さない. nそこで,以下の条件を満たす対照群を見つける. • 処置の効果を受けない. • 処置の影響を受ける処置ユニットと同じトレンドを有する(平行トレンドの仮定). n対照群の処置前のアウトカムを𝑊"#$,処置後のアウトカムを𝑊"%&'とする. n処置の影響を受けていないトレンド= 𝑊"%&' − 𝑊"#$. 12

Slide 13

Slide 13 text

差分の差法 n差分の差法における因果効果= 𝑌"%&' − 𝑌"#$ − (𝑊"%&' − 𝑊"#$) nこの因果効果は処置群上の平均処置効果(ATT)と呼ばれる. 13 処置 ユニット 処置𝑇! 𝑌"#$ 時間 アウトカム 𝑌"%&' 𝑊"#$ 𝑊"%&' 非処置 ユニット 平行トレンド 反実仮想的な処置を 受けなかった時の𝑌"%&' 処置効果

Slide 14

Slide 14 text

差分の差法 n差分の差法:二つの時系列の差分の差によって因果効果を識別するアイデア. • 因果効果をATTとし,それを平行トレンド仮定のもとで,差分の差法を用いること で,識別・推定する手法. • 平行トレンド仮定のもとでのパネルデータ解析の一種として考えることもできる. ユニット固有の固定効果と時間固有の固定効果を加味. n重要な仮定:平行トレンド仮定. 14

Slide 15

Slide 15 text

差分の差法の例:コレラ nJohn Snow氏の研究: • 差分の差法を用いて,コレラの原因が汚染された水であることを発見. • 汚染されたテムズ川から水を引いていた二つの水道会社. • Lambeth水道会社は1849年に綺麗なテムズ川の上流を水源に変える. n1万世帯あたりの コレラ患者数の表. 15

Slide 16

Slide 16 text

差分の差法の例:コレラ n1849年,1万世帯あたりのコレラ患者数: • Southwark and Vauxhall(SV)水道会社で135人. • Lambeth(L)水道会社で85人. n1854年: • SV水道会社では1万世帯あたり147人. • L水道会社の1万世帯あたり19人 16

Slide 17

Slide 17 text

差分の差法の例:コレラ n差分の差法に基づく処置効果の推定. • Lambeth水道会社の1854年の値(135)を1849年の値(147)から差分(-12). • 続いてSouthwark and Vauxhall水道会社も同様に差分を計算(85-19=66). • ATTが1万世帯あたり78(=66-(-12) )人の死者減少に相当するという推定値. 17

Slide 18

Slide 18 text

差分の差法と合成コントロール法 n差分の差法と合成コントロール法は密接に関連(Arkhangelsky et al. (2021)). • 共通の問題意識:観測できない比較事例を代替する. • 応用事例・仮定している状況は異なる. n差分の差法:処置に曝されるユニットの数が多く,「平行トレンド」を仮定できる. n合成コントロール法:単一の(あるいは少数の)ユニットが処置に曝される環境を 想定.ユニットを処置に曝される前のトレンドに合わせて,処置されていないユ ニットの加重和を用いることで,平行トレンドの欠如を補う. 18

Slide 19

Slide 19 text

合成コントロール法 nある時点𝑇! において,単一(あるいは少数の)処置ユニットに処置が発生. n複数の非処置ユニットのアウトカムの加重平均により合成ユニットを作成. 19 処置 ユニット 処置𝑇! 時間 アウトカム 合成ユニット 非処置ユニット1 非処置ユニット2 処置効果

Slide 20

Slide 20 text

合成コントロール法 n合成ユニット:処置ユニットが処置に曝されなかった場合の反実仮想的な値. • 合成ユニットは回帰分析によって作成される. 20 処置 ユニット 処置𝑇! 時間 アウトカム 合成ユニット 非処置ユニット1 非処置ユニット2 処置効果

Slide 21

Slide 21 text

合成コントロール法 n𝐽 + 1個のユニット1,2, . . , 𝐽 + 1と時間1,2, … , 𝑇が存在. nユニット1はある時点𝑇! において処置に曝される. n時点𝑡における, • ユニット𝑗の処置に曝されない場合の(潜在)アウトカムと𝑌 +' ,する. • 時点𝑡 > 𝑇! における処置ユニット1のアウトカムを𝑌-' . とする. • 時点𝑡 > 𝑇! において𝑌-' ,は観測できない. 21

Slide 22

Slide 22 text

合成コントロール法 nある時点𝑡におけるユニット𝑗の観測されるアウトカムを𝑌 +' とする. • 𝑗 = 1(処置ユニット):𝑡 ≤ 𝑇! において𝑌-' = 𝑌-' ,, 𝑡 > 𝑇! において𝑌-' = 𝑌-' . • 𝑗 = 2, … , 𝐽 + 1(非処置ユニット):全ての𝑡において𝑌 +' = 𝑌+' ,. nある時点𝑡 > 𝑇! における処置にユニットに対する処置効果: 𝜏-' = 𝑌-' . − 𝑌-' , n𝑌-' ,を観測することはできないので,推定量4 𝑌-' ,で置き換える必要がある. 22

Slide 23

Slide 23 text

合成コントロール法 nある適当な重み𝑤+ ∗を用いて, 𝑌-' ,の推定量4 𝑌-' ,を以下のように構築する: 4 𝑌-' , = 6 +01 23- 𝑤+ ∗𝑌 +' = 6 +01 23- 𝑤+ ∗𝑌 +' , . 説明の都合上,推定量ではあるが真値𝑤! ∗を用いている, " 𝑌#$ %を𝑌 !$ の線型結合で推定(予測)することを伝えたい. データ生成過程は論文によって異なる.かならずしも𝑌#$ %の期待値が𝑌 !$ の期待値の線型結合であるわけではない? nそして処置効果𝜏-' の推定量を ̂ 𝜏-' = 𝑌-' . − 4 𝑌-' ,とする. n適当な重み𝑤+ ∗は最小二乗法などによる推定量で置き換える.例えば, 8 𝑤1, … , 8 𝑤23- 4 = arg min 5$,…,5%&' ( ∈ℝ% 6 '0- :);- 𝑌-' − 6 +01 23- 𝑤+𝑌 +' 1 . 23

Slide 24

Slide 24 text

合成コントロール法における課題と解決策

Slide 25

Slide 25 text

合成コントロール法の課題と対策 n合成コントロール法はただのパネルデータを用いる(線形)回帰. • それだけなら通常の回帰の手法を用いれば良い. n応用上,しばしば想定される「非処置ユニット数が大きくて,時系列が短い」問題. • 最小二乗法 min 5$,…,5%&' ( ∈ℝ% ∑ '0- :);- 𝑌-' − ∑ +01 23- 𝑤+ 𝑌 +' 1 を再考する. nユニット数(次元数)𝐽が大きく,時系列の長さ(サンプルサイズ)𝑇! が短い場合. → 推定量8 𝑤1, … , 8 𝑤23- の振る舞いが不安定になる. 25

Slide 26

Slide 26 text

合成コントロール法の課題と対策 n「ユニット数(𝐽)が大きくて,時系列(𝑇! )が短い」問題への対策. nAbadie and Gardeazabal (2003),Abadie, Diamond, and Hainmueller (2010). • 合成コントロール法を(「初めて」)明示的に提案した研究. • その意味で「標準的な」合成コントロール法. • 制約付き最小二乗法でパラメータを推定. • 推論にはフィッシャーの正確検定などを用いる. 26

Slide 27

Slide 27 text

合成コントロール法の課題と対策 n「ユニット数が大きくて,時系列が短い」問題は高次元モデルの推定と似ている, nスパース性を仮定して,Lasso回帰・Ridge回帰・Elastic netなどを適用. • Ben-Michael, Feller, and Rothstein (2018): Ridge回帰(拡張合成コントロール法). • Carvalho, Masini, and Medeiros (2018): Lasso回帰. • Doudchenko and Imbens (2016): Elastic net. • 推論にはブートストラップ法(conformal predictionを含む)などを用いる. 27

Slide 28

Slide 28 text

合成コントロール法の課題と対策 n様々な解決策がある. • OLS・制約付き最小二 乗法・Lasso・Ridge・ Elastic net • ベイジアン. • Spike-and-slab 表はKim et al. (2020)より引用. 28

Slide 29

Slide 29 text

「標準的な」合成コントロール法 nAbadie and Gardeazabal (2003) ・Abadie, Diamond, and Hainmueller (2010). • もっとも「標準的な」合成コントロール法. • 制約付き最小二乗法により重みを推定. 8 𝑤1, … , 8 𝑤23- 4 = arg min 5$,…,5%&' ( ∈ℝ% 6 '0- :);- 𝑌-' − 6 +01 23- 𝑤+𝑌 +' 1 s. t. 𝑤+ ≥ 0 ∀𝑗 and 6 +01 23- 𝑤+ = 1. n最小二乗法の解を安定させるためや解釈性のための制約.重みは比率. 29

Slide 30

Slide 30 text

「標準的な」合成コントロール法 ØAbadie and Gardeazabal (2003):バスク地方におけるテロの影響を評価. nETA(テロ組織)によるバスク地方でのテロ. • 1968年から1990年代の半ば. • 目的:資金調達 → ターゲットは起業家. → 起業家がバスク地方から逃げる. • 結果の予想:バスク地方の1人当たりGDPが低下. nスペインの他の州を用いて合成ユニットを作成. 30

Slide 31

Slide 31 text

「標準的な」合成コントロール法 プラシーボ研究 n疑問. • 図の実際のGDPと反実仮想のGDPの差が本当にテロの影響なのか? • テロがない場合のバスク地方の成長経路を再現できなかった誤差なのか? n 「プラシーボ研究」でこの疑問を解決する. • バスク地方に用いた方法を「非テロ地域」(バスク以外の地域)に適用. • バスク地方と似ているが,テロ活動が活発でない地域の経済発展を,同じくテロ 活動が活発でない合成ユニットの経済発展と比較する. 31

Slide 32

Slide 32 text

「標準的な」合成コントロール法 プラシーボ研究 nプラシーボ研究の目的. • バスク地方で観察された差分が,テロ以外の要因によって生じた可能性がある かどうかを評価すること. nこの「プラシーボ」研究を行うために,バスク地方の合成コントロール推定量で最 も大きなウェイトを占めるカタルーニャを選ぶ. • カタルーニャ:経済成長決定要因においてテロ以前のバスク地方と最も似てい る地域であることに加え,多くの特性においてバスクと似ている. 32

Slide 33

Slide 33 text

「標準的な」合成コントロール法 プラシーボ研究 n右図:カタルーニャの実際の一人当たり 実質GDPの推移と,スペインの他の地域 (バスク地方を除く)を加重平均して作成 した「合成カタルーニャ」が示唆する一人 当たり実質GDPの推移. • (注意)1992年にバルセロナオリンピックの結果,カタ ルーニャ州がこの時期に多額の投資と経済拡大を経験. 33

Slide 34

Slide 34 text

「標準的な」合成コントロール法 nAbadie, Diamond, and Hainmueller (2010):カリフォルニア州におけるタバコ規制 であるProposition 99のタバコ年間売上高への影響. 34 カリフォルニア州と他州との比較.Proposition 99を施行していない他州でも タバコの年間売上高は減少傾向. 合成コントロール法を用いて,処置ユニット(カリフォルニア州)がProposition 99 を施行しなかった場合の反実仮想的なアウトカムを予測.

Slide 35

Slide 35 text

Doudchenko and Imbens (2016) n制約はなくてもいい?→ 推定量が安定すればいい. nDoudchenko and Imbens (2016):LassoやRidge回帰の使用を提案. • Elastic net型の目的関数. 切片項𝜇も追加する. ! 𝑤!, … , ! 𝑤"#$ % = arg min &!,…,&"#$ % ∈ℝ" , +,$ -&.$ 𝑌$+ − 𝜇 − , /,! "#$ 𝑤/𝑌 /+ ! + 𝜆 ⋅ 1 − 𝛼 2 𝒘 ! ! + 𝛼 𝒘 . nこうした推定量が各種提案されてきた. 35

Slide 36

Slide 36 text

拡張合成コントロール法 nBen-Michael, Feller, and Rothstein (2018)によるRidge回帰的な方法. • 各ユニット𝑗が処置されなかった場合のアウトカムのデータ生成過程: 𝑌 +' , = 𝑚+' + 𝜀+' . 𝜀+' はsubgassian (0, 𝜎). • 𝑚+' の推定量を 8 𝑚+' とする. 8 𝑚+' は過去の𝑌 +' ,から作られる(時系列?). • Ridge回帰を用いることを提案.モデルは線形モデルとlatent factorモデルの二つを検証. n𝑌:) ,を予測する問題を考える. n拡張合成コントロール推定量:4 𝑌-:) ,,<=> = ∑ +01 23- 8 𝑤+𝑌 +:) + 8 𝑚-:) − ∑ +01 23- 8 𝑤+ 8 𝑚+:) . 36

Slide 37

Slide 37 text

拡張合成コントロール法 n 8 𝑚+' が線形モデルであるとする.つまり, 8 𝑚+' = ̂ 𝜂! + ∑ '0- :);- ̂ 𝜂'𝑌 +' 4. nパラメータはRidge回帰で推定する.つまり, ̂ 𝜂0 12345, ! 𝜼12345 = arg min 6&,𝜼, 6' ' 1 2 , /,! "#$ 𝑌 /-& − 𝜂0 + , +,$ -&.$ 𝜂+𝑌 /+ % ! + 𝜆12345 𝜼 ! !. nRidge回帰の解析解を代入すると,拡張合成コントロール推定量は, ; 𝑌$-& 894 0 = , /,! "#$ = 𝛾/ 894𝑌 /-& . 37

Slide 38

Slide 38 text

拡張合成コントロール法 n 計算のために変数を新しく定義する. 𝑈0⋅ = 𝑌$$ ⋯ 𝑌$-& , 𝑈$⋅ = 𝑌!$ ⋯ 𝑌!(-&.$) ⋮ ⋮ ⋮ 𝑌("$)$ ⋯ 𝑌("$)(-&.$) . n すると,= 𝛾= 894 = = 𝛾= >?@ + 𝑈$⋅ − 𝑈0⋅ % = 𝛾>?@ % 𝑈0⋅ %𝑈0⋅ + 𝜆A=BCD𝐼-& .$ . n これと同値の定式化は以下のようになる: min 𝒘 F.+.∑ ()! "#$ &(,$ 1 2𝜆12345 , +,$ -&.$ 𝑌$-& − , /,! "#$ 𝑤/𝑌 /+ ! + 1 2 𝒘 ! !. n 推論はConformal inferenceで行う. 38

Slide 39

Slide 39 text

推論

Slide 40

Slide 40 text

推論 n処置効果𝜏の推定量は ̂ 𝜏-' = 𝑌-' . − 4 𝑌-' ,. Ø帰無仮説𝐻! : 𝜏 = 𝜏! (例えば,𝜏! = 0で効果なし). n「ユニット数が大きくて,時系列が短い」→漸近論が使えない. nAbadieはフィッシャーの正確確率検定のような検定方法を慰安. nLassoなど高次元統計の手法を用いる場合でも検定可能. • Conformal inference. 40

Slide 41

Slide 41 text

推論:フィッシャーの正確確率検定 n帰無仮説をとする. nフィッシャーの正確確率検定に近い検定方法を用いる. • サンプルサイズが小さい2カテゴリーデータに対する検定方法. • 男女のダイエットへの参加(wikipediaより). • 帰無仮説は「母集団における男女それぞれのダイエット・非ダイエットの人数の割合は等しい」. 41 この割合が帰無仮説のもとで実現する確率: 𝑝 = 𝑎 + 𝑏 ! 𝑐 + 𝑑 ! 𝑎 + 𝑐 ! 𝑏 + 𝑑 ! 𝑎! 𝑏! 𝑐! 𝑑! . この確率からp値を求める.

Slide 42

Slide 42 text

推論:Abadie et al. (2003, 2010)とAbadie et al. (2015) nAbadie et al. (2003, 2010)とAbadie et al. (2015). • どちらも基本的な考え方はフィッシャーの正確確率検定に近い. nFirpo and Possebom (2017)に詳細な説明. nAbadie et al. (2003, 2010):プラシーボ研究を(そのまま)検定に利用. • 数学的な操作はあまりしていない(?).よく分からなかった(調査中). 42

Slide 43

Slide 43 text

推論:Abadie et al. (2015) n想定している状況. • ある𝑡 ∈ {𝑇! + 1, … , 𝑇}において R 𝛼+' が非常に大きい. • 他の期ではそこまで大きくない. • Abadie et al. (2003, 2010)のような,プラシーボ研究では判断できない. np値を計算して,帰無仮説を棄却するかどうかを判断する. 43

Slide 44

Slide 44 text

推論:Abadie et al. (2015) 1. 非処置データに合成コントール法を繰り返し適用.プラセボ効果の分布を得る. 2. それぞれのプラセボについて介入前の期間についてRMSPEを計算する. RMSPE=平均二乗予測誤差の平方根. 3. それぞれのプラセボについて介入後の期間についてRMSPEを計算する. 4. 介入後と介入前のRMSPEの比を計算する. 5. この比を降順に並べる. 6. 介入群のユニットの分布における比率を計算する. 44

Slide 45

Slide 45 text

推論:Abadie et al. (2015) n𝑗 ∈ {1,2, … , 𝐽 + 1}に対して, 𝑅𝑀𝑆𝐸+ = ∑'0:)3- : 𝑌 +' − 4 𝑌 +' , /(𝑇 − 𝑇! ) ∑'0:)3- : 𝑌 +' − 4 𝑌 +' , /𝑇! . np値を以下のように計算する: 𝑝 ≔ ∑ +01 23- 1[𝑅𝑀𝑆𝐸+ ≥ 𝑅𝑀𝑆𝐸-] 𝐽 + 1 . 45

Slide 46

Slide 46 text

推論:Conformal inference n Conformal inference • 2005年ごろから発展してきた,予測のための推論を行うブートストラップ法の一種. • Chernozhukov, Feng, and Titiunik (2019):合成コントロール法における使用を提案. • Chernozhukov, Wüthrich, and Zhu (2018):Conformal inferenceそのものに対する理論解析. https://www.youtube.com/watch?v=Wcm9Uw0YL8A&t=60s n その他,参考になる資料: • https://matheusfacure.github.io/python-causality-handbook/Conformal-Inference-for-Synthetic-Control.html • Shafer and Vovk (2007) “A Tutorial on Conformal Prediction” (JMLR). Lei et al. (2017) “Distribution-Free Predictive Inference For Regression” • Ben-Michael, Feller, and Rothstein (2018). 46

Slide 47

Slide 47 text

推論:Conformal inference n三段階からなる推論. 1. 「強い」帰無仮説𝐻! : 𝜏 = 𝜏! のもとで,処置ユニットの調整された処置後アウト カム ] 𝑌-' = 𝑌-' − 𝜏! を作成し,データセットに追加する. 2. ] 𝑌-' を予測する合成ユニットを,𝑇までのデータを全部用いて,合成コントロー ル法を用いて作成する. その重みを8 𝑤+' (𝜏! )とする. 3. 調整後の処置後のアウトカムに対する残差] 𝑌-' − ∑ +01 23- 8 𝑤+'(𝜏!)𝑌 +' が,処置前 のアウトカムと「conformal(適合的)」であるかどうかのp値を計算する. 47

Slide 48

Slide 48 text

推論:Conformal inference nアイデア. • 分布に対して仮定を置くことなく,信頼区間を得ることができる. • 「強い」帰無仮説𝐻! : 𝜏 = 𝜏! を考える. • 処置効果は 𝜏! と仮定されているので,その仮定のもとで,処置されたユニットの, 処置後の,処置されなかった場合のアウトカムを4 𝑌 +' , = 𝑌 +' . − 𝜏! と推定. • そのデータを使って予測モデルを構築. • その予測モデルとデータが適合的(conformal)かどうかを調べる. 48

Slide 49

Slide 49 text

合成コントロール法の仮定

Slide 50

Slide 50 text

n合成コントロール法のアイデアや手法を紹介した. n合成コントロール法の仮定について再考する. nいつ正当化されるのか?どのような状況なら使えるのか?線形性は妥当? nどのような状況だと使えないのか? nFerman and Pinto (2021):合成コントロール法のモデルの特定. nShi et al. (2022):合成コントロール法の線形性の由来. 合成コントロール法はいつ正当化されるのか 50

Slide 51

Slide 51 text

Ferman and Pinto (2021) Synthetic controls with imperfect pretreatment fit n「標準的な」合成コントロール法:回帰が完璧(後で定義)であることを仮定. • しかし,実際にはそうでないことがある=モデルが反実仮想を予測できない. • 予測(当てはまり)が悪い場合,なんらかの意味でバイアスが生じる. • 合成コントロール法が暗黙的に置いていた仮定を明らかにした研究. 51

Slide 52

Slide 52 text

Ferman and Pinto (2021) 因子モデル n潜在アウトカム: 𝑌 +' , = 𝑐+ + 𝛿' + 𝜆' 𝛾+ + 𝜖+' , 𝑌 +' . = 𝜏+' + 𝑦+' ,. • ここで,𝛿+ はユニット間で等しい未観測共通因子,𝑐/ は未知の時間不変な固定効果,𝜆+ は未観 測共通因子の(1×𝐹)ベクトル,𝛾/ は(𝐹×1)ベクトルの未知の因子負荷量,誤差項𝜖/+ は未観測の 時間・ユニット固有のショック. • 𝑐/, 𝛾/ /,0 " は固定されており, 𝜆+ +,$ - , 𝛿+ +,$ - , 𝜖/+ +,$ - は確率的とする. • 𝔼 𝜖/+ = 0. 52

Slide 53

Slide 53 text

Ferman and Pinto (2021) 従来の合成コントロール法 Ø今までの合成コントロール法が考えていた状況. n 以下の集合を考える. K Φ = 𝑤!, … , 𝑤"#$ % ∈ ℝ"| , /,! "#$ 𝑤/ = 1, 𝛾0 = , /,! "#$ 𝛾/𝑤/ , 𝑐0 = , /,! "#$ 𝑐/𝑤/ . n K Φが空でないとき,その要素𝑤∗を用いて実行不可能な合成コントロール推定量 ̂ 𝜏$+ ∗ = 𝑌$+ − , /,! "#$ 𝑌 /+𝑤∗ = 𝜏$+ + 𝜖$+ − , /,! "#$ 𝜖/+𝑤∗ を考えることができる.これは不偏(バイアスがない)推定量(𝔼 ̂ 𝜏$+ ∗ = 𝜏$+ ). n Abadie, Diamond, and Haimueller (2010)はこうした? Φに対する仮定をしていない. • 代わりに,𝑌(' = ∑ )*+ ,-( 𝑤∗𝑌 )' となる重み𝑤∗の存在を仮定=「完璧な処置前の適合」. 53

Slide 54

Slide 54 text

Ferman and Pinto (2021) モデル誤特定 n現実に実行できる合成コントロール法の推定量を8 𝑤+ DEとする. n未観測共通因子𝜆' と誤差項𝜖+' の両方に系列相関を許容する. nこのとき,合成コントロール推定量は,𝑇! → ∞において, ̂ 𝜏$+ JK = 𝑌$+ − , /,! "#$ ! 𝑤/ JK𝑌 /+ → L 𝜏$+ + 𝜆+ 𝛾$ − , /,! "#$ 𝛾/ ! 𝑤/ JK + 𝑐$ − , /,! "#$ 𝑐/ ! 𝑤/ JK + 𝜖$+ − , /,! "#$ 𝜖/ ! 𝑤/ JK . • ここで, 𝛾- ≠ ∑ +01 23- 𝛾+ 8 𝑤+ DE,かつ,𝑐! ≠ ∑ +01 23- 𝑐+ 8 𝑤+ DE. • これはバイアスがある推定量(𝔼 ̂ 𝜏-' ≠ 𝜏-' )をもたらす. 54

Slide 55

Slide 55 text

Ferman and Pinto (2021) 差分の差推定量 n固定効果𝑐+ と𝛿' が,ユニット・時間平均で表される場合(平行トレンド). nこのとき,差分の差法による処置効果の推定量は,𝑡 ∈ {𝑇!, … , 𝑇}に対して, ̂ 𝜏$+ MNM = 𝑌$+ − 1 𝐽 − 1 , /,! "#$ 𝑌 /+ − 1 𝑇0 − 1 , F,$ -&.$ 𝑌$F − 1 𝐽 − 1 , /,! "#$ 𝑌 /F → L 𝜏$+ + 𝜆+ 𝛾0 − 1 𝐽 − 1 , /,! "#$ 𝛾/ + 𝜖$+ − 1 𝐽 − 1 , /,! "#$ 𝜖/+ 𝑎𝑠 𝑇0 → ∞. • 𝔼 𝜆' = 0であるならば不偏推定量. Ø平行トレンドの仮定が成立していない場合にはバイアスがある. 55

Slide 56

Slide 56 text

Ferman and Pinto (2021) 平均が引かれた合成コントロール推定量 n差分の差法と合成コントロール法を組み合わせた推定量を考える: ! 𝑤MJK = arg min 𝒘 F.+.∑ ()! "#$ &(,$ , +,$ -&.$ 𝑌$+ − , /,! "#$ 𝑤/𝑌 /+ − 1 𝑇0 − 1 , +,$ -&.$ 𝑌$+ − , /,! "#$ 𝑤/ 1 𝑇0 − 1 , +,$ -&.$ 𝑌 /+ ! . • 事前に平均 - 2;- ∑ +01 2;- 𝑌 +' を𝑌 +' から引く(Demeaned SCM (DSCM)推定量). nΦ = 𝑤1 , … , 𝑤23- 4 ∈ ℝ2| ∑ +01 23- 𝑤+ = 1, 𝛾- = ∑ +01 23- 𝛾+ 𝑤+ に対して, ̂ 𝜏$+ MJK = 𝑌$+ − , /,! "#$ ! 𝑤/ MJK𝑌 /+ → L 𝜏$+ + 𝜆+ 𝛾$ − , /,! "#$ 𝛾/ ! 𝑤/ MJK + 𝜖$+ − , /,! "#$ 𝜖/ ! 𝑤/ MJK . 56

Slide 57

Slide 57 text

Ferman and Pinto (2021) 平均が引かれた合成コントロール推定量 nユニットごとの固定効果が存在していても, 𝛾- = ∑ +01 23- 𝛾+ 8 𝑤+ DEなら不偏. • 𝑐! ≠ ∑ +01 23- 𝑐+ 8 𝑤+ DEを許容する. n適当な仮定のもとで,DSCMの平均二乗誤差(MSE)は,DIDのMSEを下回る. nConformal inferenceに基づく仮説検定も提案. 57

Slide 58

Slide 58 text

Ferman and Pinto (2021) 実験結果 58 ØAbadie and Gardeazabal (2003):バスク地方におけるテロの影響を評価.

Slide 59

Slide 59 text

Shi, Sridhar, Misra, and Blei (2022) On the Assumptions of Synthetic Control Methods Ø合成コントロール法は因果効果を推定できているのか? n線形性の仮定は妥当か? n処置ユニットと未処置ユニットを構成するより細かいユニットに着目. → 因果効果を推定するための十分条件を導出. n従来の合成コントロール法の分析単位は州や国などの大きな単位. nそれらを構成するきめ細かな(fine-grained)単位に着目. • 従来の合成コントロール法のユニットは,より細かなユニットのグループ. 59

Slide 60

Slide 60 text

Shi, Sridhar, Misra, and Blei (2022) On the Assumptions of Synthetic Control Methods nあるユニット𝑗を,きめ細かな単位𝑖からなるグループであるとする. n処置を受ける/受けなかった場合の潜在アウトカムを 𝑌F+' . , 𝑌F+' , とする. n潜在アウトカムに影響を及ぼす未観測変数を𝑍F+' ∈ ℝGとする. n𝑌と𝑍の関係は,線形でも非線形でもよく,時間によって変化可能. 60 𝑌/(' 0 𝑌/(' 0 𝑌/(' 0 𝑌/+' 0 𝑌/+' 0 𝑌/+' 0 𝑌/1' 0 𝑌/1' 0 𝑌/1' 0 𝑗 = 1 𝑗 = 2 𝑗 = 3 𝑌(' 0 𝑌+' 0 𝑌1' 0 従来の仮定 新しい仮定

Slide 61

Slide 61 text

Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 nここで,小ユニット𝑖について推論し,各グループ𝑗を小ユニットの分布として扱う. n小ユニットレベルの潜在アウトカム(𝑌F+' , )のデータ生成過程 • 明示的なパラメトリックな仮定をしない. • 𝑌F+' , と𝑍F+' はノンパラメトリック.かつ, 𝑍F+' は未観測. nそれでも,グループ単位で線形性が成立する方法を示す. → 合成コントロール法を実行できる. 61

Slide 62

Slide 62 text

Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 n因果効果の識別につながる不変性の仮定について述べる. Ø第一の仮定:独立した因果メカニズム(ICM). • 原因𝑍(すなわちその「メカニズム」)を与えられた各変数の条件分布は,他の条 件分布に情報を与えず,影響を与えないという原則(Schölkopf et al.,2012). n仮定A1(ICM). • 原因𝑍の条件付きで,潜在アウトカム𝑌,は母集団分布𝑗に依存しない. • 時刻𝑡 ≤ 𝑇における母集団分布jに対して,𝑌,と𝑍の結合分布は以下の通り: 𝑃+' 𝑍, 𝑌, = 𝑃+' 𝑍 𝑃' 𝑌, 𝑍 . 62

Slide 63

Slide 63 text

Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 nこの仮定は,個々の原因𝑍の分布はグループと時間の間で変化しうるが,条件 付きアウトカム𝑌,|𝑍は時間によってのみ変化する,というもの. n各時点𝑡について,個人の潜在的原因𝑍をすべて知っているかどうかは,そのコ ントロール潜在アウトカムの分布についての追加情報を与えない. n上式を用いて、期待反実仮想アウトカムは次のようになる: 𝔼' 𝑌 +' , = 6 L 𝔼' 𝑌, 𝑍 = 𝑧 𝑃+'(𝑍 = 𝑧) • ここで,𝔼' は𝑃'(𝑌,|𝑍 = 𝑧)に関する期待値を表し,グループ間で不変. 63

Slide 64

Slide 64 text

Shi, Sridhar, Misra, and Blei (2022) ファクターモデルとの比較 nグループ・レベルのファクターモデル(Ferman and Pintoモデルの固定効果𝑐! と𝜆$ をゼロ): 𝑌 +' , = 𝜆' 𝛾+ + 𝜖+' , 𝑌 +' . = 𝜏+' + 𝑦+' ,. • 𝔼 𝑌 +' , = ∑L 𝔼' 𝑌, 𝑍 = 𝑧 𝑃+'(𝑍 = 𝑧)はファクターモデルと似ている. • ファクターモデルのベクトル𝜆' は条件付き期待アウトカムのベクトルと解釈. • 原因𝑍F+' と潜在的な結果𝑌F+' , の間の関係については,何も仮定していない. n式𝔼 𝑌 +' , = ∑L 𝔼' 𝑌, 𝑍 = 𝑧 𝑃+'(𝑍 = 𝑧)の線形性 ↑グループ・レベルのアウトカムは小ユニットレベルのアウトカムの平均. 64

Slide 65

Slide 65 text

Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 n 第2の仮定:安定分布.原因𝑍を二つの原因に分解できるとする. • 1. 処置ユニットと未処置ユニットで異なる原因.2. 処置ユニットと未処置ユニットで不変の原因. n 仮定A2:原因を2つの部分集合𝑍={𝑈, 𝑆}に分解する. • 処置ユニットと未処置ユニットを区別する部分集合を𝑆とする. = 処置グループにおける分布は,未処置グループにおけるその分布と異なる. • すべてのグループにおいて,𝑆の分布はすべての時間𝑡 ≦ 𝑇で変化しない. 𝑃/+ 𝑍 = 𝑃/ 𝑆 𝑃+ 𝑈 𝑆 . n 部分集合𝑆は,グループによって異なるが,時間に対して不変な原因を含む. n 𝑈の条件付き分布は,時間によって変化するが,グループに対して不変. n 𝑆を最小不変集合と呼ぶ. 65

Slide 66

Slide 66 text

Shi, Sridhar, Misra, and Blei (2022) Fine-Grained Modelに対する不変性仮定 n ICMと安定分布より,𝔼 𝑌 /+ O = ∑(P,F) 𝔼+ 𝑌O 𝑈 = 𝑢, 𝑆 = 𝑠 𝑃+(𝑈|𝑆)𝑃/(𝑆 = 𝑠). • ここで,𝑢に対して先に和を計算すると,期待アウトカムは. 𝔼 𝑌 /+ O = , F 𝔼+ 𝑌O 𝑆 = 𝑠 Q' 𝑃/(𝑆 = 𝑠) R( n 上式とファクター・モデル𝑌 /+ O = 𝜆+𝛾/ + 𝜖/+ を比較する. • 𝔼+ 𝑌O 𝑆 = 𝑠 ≈ 𝜆+ と𝑃/ 𝑆 = 𝑠 ≈ 𝛾/ . n ファクター・モデルは不変性仮定と安定性仮定に由来. 66

Slide 67

Slide 67 text

Shi, Sridhar, Misra, and Blei (2022) 因果効果の識別可能性 n 追加で以下の仮定を置く. n 仮定A3 (十分に類似した未処置グループ). • 合成コントロールを構築するために使用する未処置グループの集合を𝐷とする. • 処置グループと未処置グループの最小不変集合を𝑆とする. • 未処置グループの基数(cardinality)が最小不変量集合の基数以上であれば,未処置グループ は十分に類似していると言える: 𝐷 ≥ 𝑆 . n 仮定A4 (対象ドナーの重複). • {𝑠$ , … , 𝑠A }を𝑆のサポートとする. • それぞれの𝑠に,未処置グループ集合𝐷に少なくとも一つグループ𝑗が存在し,𝑃/ 𝑆 = 𝑠 > 0. 67

Slide 68

Slide 68 text

Shi, Sridhar, Misra, and Blei (2022) 因果効果の識別可能性 n 定理1.(因果効果の識別可能性) • 因果的メカニズムが独立(仮定A1). • 処置ユニットと未処置ユニットは安定(仮定A2). • 選ばれたドナーは互いに十分に似ている(仮定A3). • 処置ユニットと未処置ユニットの間に重複がある(仮定A4). • 重みの集合 𝛽/ /∈["] が存在し,すべての期間にわたって,処置ユニットの反実仮想は,未処置 ユニットのアウトカムの重み付き和として書ける: 𝔼 𝑌0+ O = , /∈["] 𝛽/𝔼[𝑌 /+ O] . 68

Slide 69

Slide 69 text

Shi, Sridhar, Misra, and Blei (2022) 因果効果の識別可能性 n 小ユニット(個人)レベルの潜在アウトカムに対して仮定を置いた. • グループ内の小ユニット(個人)にはパラメトリックな仮定をしていない. n それでも,グループのアウトカムに対する線形性を得られる: 𝔼 𝑌0+ O = , /∈["] 𝛽/𝔼[𝑌 /+ O] → グループ内の小ユニット(個人)のアウトカムは𝑍に対して非線形でも良い. 69

Slide 70

Slide 70 text

Shi, Sridhar, Misra, and Blei (2022) 示唆1:グループの種類の混在 Øグループの種類の混在 • 何がユニットとして扱われうるか. n 古典的な合成コントロール法:州など,同じ種類の集合をグループとして扱う. • Fine-grainedモデルは,各グループが個人のグループであればよい. • ターゲットと同じ種類のグループである必要はない. n 各未処置グループの影響力:処置グループや他の未処置グループとの差異. • つまり,最小不変集合の基数(cardinality)に関係. 70

Slide 71

Slide 71 text

Shi, Sridhar, Misra, and Blei (2022) 示唆2:非線形データ生成過程を用いた合成コントロール法 Ø非線形データ生成過程を用いた合成コントロール法. • これまでの研究: 𝑌 /+ O = 𝜆+𝛾/ + 𝜖/+ のような線形因子モデルの仮定から始まる. • パラメトリックモデルの役割は,因果効果の識別のためなのか,統計的な必要性のためなのか, 表記上の便宜のためなのかは不明? • 真のメカニズムが線形であると仮定することは,非現実的な仮定となり得る. 71

Slide 72

Slide 72 text

Shi, Sridhar, Misra, and Blei (2022) 示唆2:非線形データ生成過程を用いた合成コントロール法 n これに対して,Fine-Grainedなモデルを用いて,なぜ合成コントロール法では基本的に線形性が 妥当な仮定となり得るのかを説明. • 推定対象を部分グループの平均効果とした. • 合成コントロール法をグループ再重み付けアルゴリズムと見立てた. • 線形因子モデルが因果効果の識別可能性の不変性仮定を内包していること. • 線形因子モデルの線形性は期待値が線形演算子であることに起因することを明らかに. n 実用的な意味合い:グループに包含される小ユニット(個人)が非線形なメカニズムを含んでい ても,グループ単位で線形モデルのもとで,因果効果の識別が可能. 72

Slide 73

Slide 73 text

Shi, Sridhar, Misra, and Blei (2022) 示唆3: 𝑆の役割と未処置グループとの関係 Ø𝑆の役割と未処置グループとの関係. • 古典的な合成コントロール法では,潜在因子𝜆+ は固定で低ランクであると仮定(Abadie, 2019). • その結果,すべての未処置グループからの情報を利用したくなることがある. • 最小不変量集合𝑆は合成コントロールの構築に使われる未処置グループの集合によって決定. • 未処置グループの集合が異なると最小不変集合も異なり,素朴に追加的に未処置グループを 含めると合成コントロールが存在しなくなる可能性がある. • たくさん未処置グループを入れすぎるのはよくない. 73

Slide 74

Slide 74 text

共変量をどう使うのか

Slide 75

Slide 75 text

補助的な共変量 n各処置ユニットを特徴づける共変量𝑋+' = (𝑋+'-, … , 𝑋+'(N;-))も入手可能. → 各ユニットごとに𝑍+' = 𝑍+'-, … , 𝑍+'N = (𝑌 +', 𝑋+'-, … , 𝑋+'(N;-))を観測. nどのように共変量𝑋+' を用いて,合成コントロール法の重みを推定するのか. 75

Slide 76

Slide 76 text

制約付き重み付き最小二乗法 nAbadie and Gardeazabal (2003)は,適当な重み𝑣 = (𝑣- , … 𝑣N )を用いて, 8 𝑤1 (𝑣), … , 8 𝑤23- (𝑣) 4 = arg min 5$,…,5%&' ( ∈ℝ% 6 P0- N 𝑣P 1 𝑇 6 '0- :);- 𝑍-'P − 6 +01 23- 𝑤+ 𝑍+'P 1 s. t. 𝑤+ ≥ 0 ∀𝑗 and 6 +01 23- 𝑤+ = 1. として, 𝑤1 ∗, … , 𝑤23- ∗ を推定することを提案. • では,重み𝑣 = (𝑣- , … 𝑣N )はどうやって決めればいいのか. • なお,この重みの決め方次第で,合成コントロール法の結果が変わることも. 76

Slide 77

Slide 77 text

重みの決め方 nAbadie and Gardeazabal (2003)は,以下の方法を提案: R 𝑣- , … , R 𝑣N 4 = arg min Q R',…,Q R, (∈ℝ, 1 𝑇 6 '0- :);- 𝑌-' − 6 +01 23- 8 𝑤+ (𝑣)𝑌 +' 1 . • つまり,関心のあるパラメータに対して,誤差を最小化するように𝑣を推定. 77

Slide 78

Slide 78 text

最適化. n 重み𝑣を = 𝑣$, … , = 𝑣U % = arg min V W$,…,V W3 %∈ℝ3 1 𝑇 , +,$ -&.$ 𝑌$+ − , /,! "#$ ! 𝑤/(𝑣)𝑌 /+ ! . として推定するためには,各𝑣ごとに, ! 𝑤!(𝑣), … , ! 𝑤"#$(𝑣) % = arg min &!,…,&"#$ % ∈ℝ" , X,$ U 𝑣X 1 𝑇 , +,$ -&.$ 𝑍$+ − , /,! "#$ 𝑤/𝑍/+ ! s. t. 𝑤/ ≥ 0 ∀𝑗 and , /,! "#$ 𝑤/ = 1. を解く必要がある.非凸最適化なので,グリッドサーチなどで頑張る. 78

Slide 79

Slide 79 text

参考文献 さ

Slide 80

Slide 80 text

• Abadie, A. and Gardeazabal, J. The economic costs of conflict: A case study of the basque country. American Economic Review, 93(1):113–132, March 2003. • Abadie, A., Diamond, A., and Hainmueller, J. Synthetic control methods for comparative case studies: Estimating the effect of california’s tobacco control program. Journal of the American Statistical Association, 105(490):493– 505, 2010. • Abadie, A., Diamond, A., and Hainmueller, J. Comparative politics and the synthetic control method. American Journal of Political Science, 59(2):495–510, 2015. • Athey, S. and Imbens, G. W. The state of applied econometrics: Causality and policy evaluation. Journal of Economic Perspectives, 31(2):3–32, May 2017 • Ben-Michael, E., Feller, A., and Rothstein, J. The augmented synthetic control method. Journal of the American Statistical Association, 116(536):1789–1803, 2021. • Chernozhukov, V., Wüthrich, K., and Zhu, Y. Inference on average treatment effects in aggregate panel data settings. cemmap working paper, 2019. • Chernozhukov, V., Wüthrich, K., and Zhu, Y. An exact and robust conformal inference method for counterfactual and synthetic controls. Journal of the American Statistical Association, 116(536):1849–1864, 2021. • Cunningham, S. and Shah, M. Decriminalizing Indoor Prostitution: Implications for Sexual Violence and Public Health. The Review of Economic Studies, 85(3):1683– 1715, 12 2017. • Doudchenko, N. and Imbens, G. W. Balancing, regression, difference-in-differences and synthetic control methods: A synthesis. Working Paper 22791, National Bureau of Economic Research, October 2016. • Ferman, B. and Pinto, C. Synthetic controls with imperfect pretreatment fit. Quantitative Economics, 12(4):1197– 1221, 2021. • Vovk, V., Gammerman, A., and Shafer, G. Algorithmic Learning in a Random World. Springer-Verlag, 2005. • Shi, C., Sridhar, D., Misra, V., and Blei, D. On the assumptions of synthetic control methods. In Proceedings of The 25th International Conference on Artificial Intelligence and Statistics, volume 151 of Proceedings of Machine Learning Research, pp. 7163–7175. 80