Slide 1

Slide 1 text

統計的因果推論の理論と実装 ~Chapter1・2~

Slide 2

Slide 2 text

前提 - Rについては触れません(が、「Rはいいぞ!」) - 基本的にテキストの章立てに沿ってスライドを作成しています が、時間の都合上、内容を抜粋しています - スライドの文字数を減らしたいという理由で、英語表記も省略 しているものが多いです

Slide 3

Slide 3 text

アジェンダ - Chapter1: 統計的因果推論の基礎の基礎 - Chapter2: 潜在的結果変数の枠組み

Slide 4

Slide 4 text

Chapter1 ~統計的因果推論の基礎の基礎~

Slide 5

Slide 5 text

相関は因果と同じではない はじめに アイスがよく売れる日には、人が溺れる事故が増える → 相関はあるが因果はない 「気温」という第3の変数(交絡因子) 気温が高いとアイスが たくさん売れる 気温が高いと海水浴場 で溺れる人が増える

Slide 6

Slide 6 text

統計的因果推論の考え方を学ぶための具体例 インターネット広告と売上高の関係 ナイーブな比較 “理想的な”比較 広告の効果 = 2000 - 1500 = 500 ? 広告の効果 = 2000 - 1900 = 100 !! 観測不可 差分の400は広告の有無とは無関係

Slide 7

Slide 7 text

統計的因果推論とは 因果関係(原因と結果の関係)をデータに基づいて推論すること 因果関係の2つの議論 効果をもたらした原因 (cause of effect) 原因がもたらした効果 (effect of cause) A B ? ? 因果の向きを特定 因果の効果を定量化 A B どれくらい? 定性的研究(フィールドワークなど) 定量的研究(統計的因果推論など) 相補的

Slide 8

Slide 8 text

反事実モデル(1/2) 観測されなかった「事実」すなわち「反事実」について考える アスピリンを飲んだから、頭痛が治った 事実 反事実(反実仮想) ※ここでは、破線の向きは因果の向きではなく時間の流れを表しています

Slide 9

Slide 9 text

反事実モデル(2/2) 難しい議論 彼女は女の子だから、髪が長い 事実 反事実(反実仮想) 「女の子」の反事実「女の子でない」を容易に一意に定めることはできない 戸籍上、男です 生物学上、男です

Slide 10

Slide 10 text

操作なくして因果なし さまざまな見解があるので、Imbens and Rubin(2015, p21)を紹介 「操作は実際に行われる必要はなく、因果効果を適切に定義するた めに、思考実験を行うことができればよい」 実験研究 人間が処置を実際に操作できる研究 (処置を無作為割付け(後述)) 観察研究 人間が処置を実際に操作できない研究 (処置を無作為割付けしていない) 統計的因果推論の目標「観察研究において実験研究と同様に因果推論できること」

Slide 11

Slide 11 text

Rubin流とPearl流の因果推論 統計的因果推論の2大巨頭 Rubin流 潜在的結果変数の枠組み (本書のテーマ) Pearl流 構造的因果モデルの枠組み (DAGとか構造方程式とか) 最近では、構造的因果モデルと機械学習を融合した「統計的因果探索」とかも 実務で利用されてたりします(LiNGAMとか) 対立的なものではなく、あくまでも相補的な関係

Slide 12

Slide 12 text

Chapter2 ~潜在的結果変数の枠組み~

Slide 13

Slide 13 text

はじめに 潜在的結果変数の枠組みでは、 因果推論は「欠測データの問題」として扱われる 氏名 広告を見た 場合の売上 広告を見ていない 場合の売上 A 1,000 0 B 1,500 1,000 C 500 500 氏名 広告を見た 場合の売上 広告を見ていない 場合の売上 A 1,000 欠測 B 欠測 1,000 C 欠測 500 欠測していないデータ 欠測しているデータ

Slide 14

Slide 14 text

潜在的結果変数の枠組み: 具体例(1/5) 数学の試験の例: 補習授業の効果を考える 設定 入学試験の点数に応じて、学生は補習授業を受けるか受けないかが決まる 補習授業が数学力の向上にどれだけ影響を与えているかを知りたい 期末試験の点数をどのように比較すれば、補習授業の効果を推定できるか?

Slide 15

Slide 15 text

潜在的結果変数の枠組み: 具体例(2/5) データの確認 変数pathには、ファイル「data02.csv」のPathを指定してください。 ファイルは下記URLからダウンロードできます。 https://www.kyoritsu-pub.co.jp/book/b10011781.html

Slide 16

Slide 16 text

ありがちなミスリーディング(1): 前後比較 潜在的結果変数の枠組み: 具体例(3/5) 効果はマイナス...? → おそらくNo 入学試験より期末試験の方が難易度が高かっただけと考えるのが自然

Slide 17

Slide 17 text

潜在的結果変数の枠組み: 具体例(4/5) ありがちなミスリーディング(2): ナイーブな比較 やっぱり効果はマイナス...? → たぶんNo 入学試験の点数が高い人たちはもともと数学力が高い可能性

Slide 18

Slide 18 text

潜在的結果変数の枠組み: 具体例(5/5) 潜在的結果変数の枠組みによる比較 平均すると10点近い効果があったみたい! 実際には潜在的結果変数は観測できないため、いろいろ工夫する必要あり

Slide 19

Slide 19 text

潜在的結果変数の枠組み: 理論 Y i : 結果変数, T i : 処置変数 実際に観測される結果 処置0の結果 処置1の結果 観測不可

Slide 20

Slide 20 text

処置効果1: 個体因果効果(ICE) 個体間における効果。個体処置効果(ITE)とも呼ばれ、以下のよう に表される。 τ i = Y i (1) - Y i (0)

Slide 21

Slide 21 text

処置効果2: 平均因果効果(ACE) 母集団における平均的な効果。平均処置効果(ATE)とも呼ばれ、以 下のように表される。 τ ATE = E[Y i (1) - Y i (0)] = E[Y i (1)] - E[Y i (0)] … (2.4)

Slide 22

Slide 22 text

処置効果3: 処置群の平均処置効果(ATT) 処置が割付けられた対象にどれくらい影響があったのかという処置 効果であり、以下のように表される。 τ ATT = E[Y i (1)-Y i (0)|T=1] = E[Y i (1)|T=1]-E[Y i (0)|T=1] … (2.5) Pythonの実行結果

Slide 23

Slide 23 text

交絡因子 処置の割付けと結果変数の両方に影響を与えている変数 数学の試験の例 補習授業の受講 期末試験の得点 入学試験の得点 交絡因子

Slide 24

Slide 24 text

方向付き非巡回グラフ: DAG 変数同士の関係を矢印を用いて視覚的に表現したもの(ざっくり) DAGのイメージ 2つの重要なDAGの定義 - 有向性(directed) 矢印の方向性がある - 非巡回(acyclic) グラフにおいて、ループが形成さ れていない 数学の試験の例 入学試験の 得点 補習授業の 受講 期末試験の 得点 実務でもDAGを描くのはめちゃめちゃ大事です!!!

Slide 25

Slide 25 text

無作為抽出と無作為割付け 観測されない交絡を統制する1番良い方法は無作為割付け 無作為抽出法 無作為割付け 標本 処置群 統制群 母集団 標本 均質 (推定可能) 均質(比較可能) 2つの集団の均質性が確率的に保証される(定量的に評価できる) 注意: 無作為抽出法≠無作為割付け

Slide 26

Slide 26 text

内的妥当性と外的妥当性 研究の評価には、2つの妥当性がある 数学の試験の例 内的妥当性 外的妥当性 補習授業を受けた学生の集団1に おける標本Aの平均的な効果 補習授業を受けた学生の集団1に おける標本Bの平均的な効果 補習授業を受けたA大学の学生の 集団の平均的な効果 補習授業を受けたB大学の学生の 集団の平均的な効果 効果を”正しく”推定できたとしても、他の集団でも妥当かどうかは考察が必要

Slide 27

Slide 27 text

Appendix

Slide 28

Slide 28 text

グレンジャー因果性がある場合 ざっくり言うと「モデルの予測精度を改善する→因果」と定義 ARモデル: Y t =b 0 +b 1 Y t-1 +u t VAR(1)モデル: Y t =b 10 +b 11 Y t-1 +b 12 X t-1 +u 1t , X t =b 20 +b 21 Y t-1 +b 22 X t-1 +u 2t とし、ある予測期間hにおけるモデルの平均2乗予測誤差をMSFE(h)とすると、 MSFE Y, VAR(1) (h) < MSFE Y, AR (h) グレンジャー因果性 X t を含めたVARモデルの予測精度 X t を含めないVARモデルの予測精度 >

Slide 29

Slide 29 text

SUTVA(Stable Unit Treatment Value Assumption) SUTVA: Stable Unit Treatment Value Assumption 因果推論を可能とするための重要な仮定 相互干渉がない 個体に対する隠れた処置がない (e.g)補習を受けた学生が補習を受け ていない学生に教える (e.g)学生Aと学生Bで受講する補習授 業の内容が異なる (2.1)式という表現はSUTVAを暗に受け入れていることが含意されている

Slide 30

Slide 30 text

ExchangeabilityとPositivity 観察データで因果推論する際に必要な2つの前提条件 Conditional ExchangeabilityとConditional Positivity Conditional Exchangeability 共変量Xで条件づけた際に、潜在 的結果変数{Y(1), Y(0)}と割付けT が独立 {Y i (1), Y i (0)} ⊥ T i | X Conditional Positivity 共変量Xで条件づけた際に、処置 の割付け確率が0より大きく1より 小さい 0 < Pr(T=1|X) < 1 SUTVA+この2つの仮定が成り立つ=強い無視可能性(strong ignorability)

Slide 31

Slide 31 text

- 因果関係: causality - 原因: cause(cf. 処置: treatment, 介入: intervention) - 結果: outcome - 効果: effect - 反事実(反実仮想): counterfactual - 潜在的結果変数: potential outcome - 操作なくして因果なし: no causation without manipulation - DAG: Direct Acyclic Graph 用語の英訳対応(出現順)

Slide 32

Slide 32 text

用語の英訳対応(出現順) - 処置群: treatment group - 統制群: contorol group(cf. 対照群) - 割付け: assignment(cf. 割当て) - 個別因果効果: ICE(Individual Causal Effect) - 個別処置効果: ITE(Individual Treatment Effect) - 平均因果効果: ACE(Average Causal Effect) - 平均処置効果: ATE(Average Treatment Effect) - ATT: Average Treatment effect on the Treated - 交絡: confounding - 無作為抽出法: random sampling - 内的妥当性: internal validity - 外的妥当性: external validity

Slide 33

Slide 33 text

参考文献 - 岩崎(2015)「統計的因果推論」朝倉書店 - 小川(2021)「Pythonによる因果分析」マイナビ出版 - 沖本(2010)「経済・ファイナンスデータの計量時系列分析」朝倉書店 - 落合[訳](2019)「入門統計的因果推論」朝倉書店 - 小林[訳](2019)「政策評価のための因果関係の見つけ方」日本評論社 - 高橋(2022)「統計的因果推論の理論と実装」共立出版 - 西山他(2019)「計量経済学」有斐閣 - 星野(2009)「調査観察データの統計科学」岩波書店 - 安井(2020)「効果検証入門」技術評論社

Slide 34

Slide 34 text

ご清聴ありがとうございました