統計的因果推論の理論と実装「潜在的結果変数の枠組み」

統計的因果推論の理論と実装 ~Chapter1・2~

前提 - Rについては触れません（が、「Rはいいぞ！」） - 基本的にテキストの章立てに沿ってスライドを作成していますが、時間の都合上、内容を抜粋しています - スライドの文字数を減らしたいという理由で、英語表記も省略しているものが多いです

アジェンダ - Chapter1: 統計的因果推論の基礎の基礎 - Chapter2: 潜在的結果変数の枠組み

Chapter1 ~統計的因果推論の基礎の基礎~

相関は因果と同じではないはじめにアイスがよく売れる日には、人が溺れる事故が増える → 相関はあるが因果はない「気温」という第3の変数（交絡因子）気温が高いとアイスがたくさん売れる気温が高いと海水浴場で溺れる人が増える

統計的因果推論の考え方を学ぶための具体例インターネット広告と売上高の関係ナイーブな比較 “理想的な”比較広告の効果 = 2000 - 1500 =
500 ? 広告の効果 = 2000 - 1900 = 100 !! 観測不可差分の400は広告の有無とは無関係

統計的因果推論とは因果関係（原因と結果の関係）をデータに基づいて推論すること因果関係の2つの議論効果をもたらした原因 (cause of effect) 原因がもたらした効果 (effect of
cause) A B ？？因果の向きを特定因果の効果を定量化 A B どれくらい？定性的研究（フィールドワークなど）定量的研究（統計的因果推論など）相補的

反事実モデル(1/2) 観測されなかった「事実」すなわち「反事実」について考えるアスピリンを飲んだから、頭痛が治った事実反事実（反実仮想） ※ここでは、破線の向きは因果の向きではなく時間の流れを表しています

反事実モデル(2/2) 難しい議論彼女は女の子だから、髪が長い事実反事実（反実仮想）「女の子」の反事実「女の子でない」を容易に一意に定めることはできない戸籍上、男です生物学上、男です

操作なくして因果なしさまざまな見解があるので、Imbens and Rubin(2015, p21)を紹介「操作は実際に行われる必要はなく、因果効果を適切に定義するために、思考実験を行うことができればよい」実験研究人間が処置を実際に操作できる研究 (処置を無作為割付け（後述）)
観察研究人間が処置を実際に操作できない研究 (処置を無作為割付けしていない) 統計的因果推論の目標「観察研究において実験研究と同様に因果推論できること」

Rubin流とPearl流の因果推論統計的因果推論の2大巨頭 Rubin流潜在的結果変数の枠組み（本書のテーマ） Pearl流構造的因果モデルの枠組み（DAGとか構造方程式とか）最近では、構造的因果モデルと機械学習を融合した「統計的因果探索」とかも実務で利用されてたりします（LiNGAMとか）
対立的なものではなく、あくまでも相補的な関係

Chapter2 ~潜在的結果変数の枠組み~

はじめに潜在的結果変数の枠組みでは、因果推論は「欠測データの問題」として扱われる氏名広告を見た場合の売上広告を見ていない場合の売上 A 1,000
0 B 1,500 1,000 C 500 500 氏名広告を見た場合の売上広告を見ていない場合の売上 A 1,000 欠測 B 欠測 1,000 C 欠測 500 欠測していないデータ欠測しているデータ

潜在的結果変数の枠組み: 具体例(1/5) 数学の試験の例: 補習授業の効果を考える設定入学試験の点数に応じて、学生は補習授業を受けるか受けないかが決まる補習授業が数学力の向上にどれだけ影響を与えているかを知りたい期末試験の点数をどのように比較すれば、補習授業の効果を推定できるか？

潜在的結果変数の枠組み: 具体例(2/5) データの確認変数pathには、ファイル「data02.csv」のPathを指定してください。ファイルは下記URLからダウンロードできます。 https://www.kyoritsu-pub.co.jp/book/b10011781.html

ありがちなミスリーディング(1): 前後比較潜在的結果変数の枠組み: 具体例(3/5) 効果はマイナス...？ → おそらくNo 入学試験より期末試験の方が難易度が高かっただけと考えるのが自然

潜在的結果変数の枠組み: 具体例(4/5) ありがちなミスリーディング(2): ナイーブな比較やっぱり効果はマイナス...？ → たぶんNo 入学試験の点数が高い人たちはもともと数学力が高い可能性

潜在的結果変数の枠組み: 具体例(5/5) 潜在的結果変数の枠組みによる比較平均すると10点近い効果があったみたい！実際には潜在的結果変数は観測できないため、いろいろ工夫する必要あり

潜在的結果変数の枠組み: 理論 Y i : 結果変数, T i : 処置変数
実際に観測される結果処置0の結果処置1の結果観測不可

処置効果1: 個体因果効果(ICE) 個体間における効果。個体処置効果(ITE)とも呼ばれ、以下のように表される。 τ i = Y i (1)
- Y i (0)

処置効果2: 平均因果効果(ACE) 母集団における平均的な効果。平均処置効果(ATE)とも呼ばれ、以下のように表される。 τ ATE = E[Y i (1)
- Y i (0)] = E[Y i (1)] - E[Y i (0)] … (2.4)

処置効果3: 処置群の平均処置効果(ATT) 処置が割付けられた対象にどれくらい影響があったのかという処置効果であり、以下のように表される。 τ ATT = E[Y i (1)-Y
i (0)|T=1] = E[Y i (1)|T=1]-E[Y i (0)|T=1] … (2.5) Pythonの実行結果

交絡因子処置の割付けと結果変数の両方に影響を与えている変数数学の試験の例補習授業の受講期末試験の得点入学試験の得点交絡因子

方向付き非巡回グラフ: DAG 変数同士の関係を矢印を用いて視覚的に表現したもの（ざっくり） DAGのイメージ 2つの重要なDAGの定義 - 有向性(directed) 矢印の方向性がある - 非巡回(acyclic)
グラフにおいて、ループが形成されていない数学の試験の例入学試験の得点補習授業の受講期末試験の得点実務でもDAGを描くのはめちゃめちゃ大事です！！！

無作為抽出と無作為割付け観測されない交絡を統制する1番良い方法は無作為割付け無作為抽出法無作為割付け標本処置群統制群母集団標本均質
(推定可能) 均質（比較可能） 2つの集団の均質性が確率的に保証される（定量的に評価できる）注意: 無作為抽出法≠無作為割付け

内的妥当性と外的妥当性研究の評価には、2つの妥当性がある数学の試験の例内的妥当性外的妥当性補習授業を受けた学生の集団1における標本Aの平均的な効果補習授業を受けた学生の集団1における標本Bの平均的な効果補習授業を受けたA大学の学生の
集団の平均的な効果補習授業を受けたB大学の学生の集団の平均的な効果効果を”正しく”推定できたとしても、他の集団でも妥当かどうかは考察が必要

Appendix

グレンジャー因果性がある場合ざっくり言うと「モデルの予測精度を改善する→因果」と定義 ARモデル: Y t =b 0 +b 1 Y
t-1 +u t VAR(1)モデル: Y t =b 10 +b 11 Y t-1 +b 12 X t-1 +u 1t , X t =b 20 +b 21 Y t-1 +b 22 X t-1 +u 2t とし、ある予測期間hにおけるモデルの平均2乗予測誤差をMSFE(h)とすると、 MSFE Y, VAR(1) (h) < MSFE Y, AR (h) グレンジャー因果性 X t を含めたVARモデルの予測精度 X t を含めないVARモデルの予測精度 >

SUTVA(Stable Unit Treatment Value Assumption) SUTVA: Stable Unit Treatment Value
Assumption 因果推論を可能とするための重要な仮定相互干渉がない個体に対する隠れた処置がない（e.g）補習を受けた学生が補習を受けていない学生に教える（e.g）学生Aと学生Bで受講する補習授業の内容が異なる (2.1)式という表現はSUTVAを暗に受け入れていることが含意されている

ExchangeabilityとPositivity 観察データで因果推論する際に必要な2つの前提条件 Conditional ExchangeabilityとConditional Positivity Conditional Exchangeability 共変量Xで条件づけた際に、潜在的結果変数{Y(1), Y(0)}と割付けT
が独立 {Y i (1), Y i (0)} ⊥ T i | X Conditional Positivity 共変量Xで条件づけた際に、処置の割付け確率が0より大きく1より小さい 0 < Pr(T=1|X) < 1 SUTVA+この2つの仮定が成り立つ＝強い無視可能性(strong ignorability)

- 因果関係: causality - 原因: cause（cf. 処置: treatment, 介入: intervention）
- 結果: outcome - 効果: effect - 反事実（反実仮想）: counterfactual - 潜在的結果変数: potential outcome - 操作なくして因果なし: no causation without manipulation - DAG: Direct Acyclic Graph 用語の英訳対応（出現順）

用語の英訳対応（出現順） - 処置群: treatment group - 統制群: contorol group（cf. 対照群）
- 割付け: assignment（cf. 割当て） - 個別因果効果: ICE(Individual Causal Effect) - 個別処置効果: ITE(Individual Treatment Effect) - 平均因果効果: ACE(Average Causal Effect) - 平均処置効果: ATE(Average Treatment Effect) - ATT: Average Treatment effect on the Treated - 交絡: confounding - 無作為抽出法: random sampling - 内的妥当性: internal validity - 外的妥当性: external validity

参考文献 - 岩崎(2015)「統計的因果推論」朝倉書店 - 小川(2021)「Pythonによる因果分析」マイナビ出版 - 沖本(2010)「経済・ファイナンスデータの計量時系列分析」朝倉書店 - 落合[訳](2019)「入門統計的因果推論」朝倉書店 -
小林[訳](2019)「政策評価のための因果関係の見つけ方」日本評論社 - 高橋(2022)「統計的因果推論の理論と実装」共立出版 - 西山他(2019)「計量経済学」有斐閣 - 星野(2009)「調査観察データの統計科学」岩波書店 - 安井(2020)「効果検証入門」技術評論社

ご清聴ありがとうございました

統計的因果推論の理論と実装「潜在的結果変数の枠組み」

統計的因果推論の理論と実装「潜在的結果変数の枠組み」

うとしん

More Decks by うとしん

Other Decks in Science

Featured

Transcript

統計的因果推論の理論と実装 ~Chapter1・2~

アジェンダ - Chapter1: 統計的因果推論の基礎の基礎 - Chapter2: 潜在的結果変数の枠組み

Chapter1 ~統計的因果推論の基礎の基礎~

統計的因果推論の考え方を学ぶための具体例インターネット広告と売上高の関係ナイーブな比較 “理想的な”比較広告の効果 = 2000 - 1500 =

統計的因果推論とは因果関係（原因と結果の関係）をデータに基づいて推論すること因果関係の2つの議論効果をもたらした原因 (cause of effect) 原因がもたらした効果 (effect of

反事実モデル(1/2) 観測されなかった「事実」すなわち「反事実」について考えるアスピリンを飲んだから、頭痛が治った事実反事実（反実仮想） ※ここでは、破線の向きは因果の向きではなく時間の流れを表しています

反事実モデル(2/2) 難しい議論彼女は女の子だから、髪が長い事実反事実（反実仮想）「女の子」の反事実「女の子でない」を容易に一意に定めることはできない戸籍上、男です生物学上、男です

Chapter2 ~潜在的結果変数の枠組み~

はじめに潜在的結果変数の枠組みでは、因果推論は「欠測データの問題」として扱われる氏名広告を見た場合の売上広告を見ていない場合の売上 A 1,000

潜在的結果変数の枠組み: 具体例(2/5) データの確認変数pathには、ファイル「data02.csv」のPathを指定してください。ファイルは下記URLからダウンロードできます。 https://www.kyoritsu-pub.co.jp/book/b10011781.html

ありがちなミスリーディング(1): 前後比較潜在的結果変数の枠組み: 具体例(3/5) 効果はマイナス...？ → おそらくNo 入学試験より期末試験の方が難易度が高かっただけと考えるのが自然

潜在的結果変数の枠組み: 具体例(4/5) ありがちなミスリーディング(2): ナイーブな比較やっぱり効果はマイナス...？ → たぶんNo 入学試験の点数が高い人たちはもともと数学力が高い可能性

潜在的結果変数の枠組み: 具体例(5/5) 潜在的結果変数の枠組みによる比較平均すると10点近い効果があったみたい！実際には潜在的結果変数は観測できないため、いろいろ工夫する必要あり

潜在的結果変数の枠組み: 理論 Y i : 結果変数, T i : 処置変数

処置効果1: 個体因果効果(ICE) 個体間における効果。個体処置効果(ITE)とも呼ばれ、以下のように表される。 τ i = Y i (1)

処置効果2: 平均因果効果(ACE) 母集団における平均的な効果。平均処置効果(ATE)とも呼ばれ、以下のように表される。 τ ATE = E[Y i (1)

処置効果3: 処置群の平均処置効果(ATT) 処置が割付けられた対象にどれくらい影響があったのかという処置効果であり、以下のように表される。 τ ATT = E[Y i (1)-Y

交絡因子処置の割付けと結果変数の両方に影響を与えている変数数学の試験の例補習授業の受講期末試験の得点入学試験の得点交絡因子

方向付き非巡回グラフ: DAG 変数同士の関係を矢印を用いて視覚的に表現したもの（ざっくり） DAGのイメージ 2つの重要なDAGの定義 - 有向性(directed) 矢印の方向性がある - 非巡回(acyclic)

無作為抽出と無作為割付け観測されない交絡を統制する1番良い方法は無作為割付け無作為抽出法無作為割付け標本処置群統制群母集団標本均質

Appendix

グレンジャー因果性がある場合ざっくり言うと「モデルの予測精度を改善する→因果」と定義 ARモデル: Y t =b 0 +b 1 Y

SUTVA(Stable Unit Treatment Value Assumption) SUTVA: Stable Unit Treatment Value

ExchangeabilityとPositivity 観察データで因果推論する際に必要な2つの前提条件 Conditional ExchangeabilityとConditional Positivity Conditional Exchangeability 共変量Xで条件づけた際に、潜在的結果変数{Y(1), Y(0)}と割付けT

- 因果関係: causality - 原因: cause（cf. 処置: treatment, 介入: intervention）

用語の英訳対応（出現順） - 処置群: treatment group - 統制群: contorol group（cf. 対照群）

参考文献 - 岩崎(2015)「統計的因果推論」朝倉書店 - 小川(2021)「Pythonによる因果分析」マイナビ出版 - 沖本(2010)「経済・ファイナンスデータの計量時系列分析」朝倉書店 - 落合[訳](2019)「入門統計的因果推論」朝倉書店 -

ご清聴ありがとうございました