Upgrade to Pro — share decks privately, control downloads, hide ads and more …

統計的因果推論の理論と実装「潜在的結果変数の枠組み」

うとしん
January 10, 2023

 統計的因果推論の理論と実装「潜在的結果変数の枠組み」

社内勉強会の発表資料です。高橋先生の「統計的因果推論の理論と実装」のChapter1と2の内容についてまとめています。

参考リンク(マイメディア)

- 相関関係と因果関係と疑似相関
https://zenn.dev/s1ok69oo/articles/3d748c399da774
- 反実仮想と因果効果
https://zenn.dev/s1ok69oo/articles/c3404a184d2203

うとしん

January 10, 2023
Tweet

More Decks by うとしん

Other Decks in Science

Transcript

  1. 統計的因果推論の理論と実装
    ~Chapter1・2~

    View Slide

  2. 前提
    - Rについては触れません(が、「Rはいいぞ!」)
    - 基本的にテキストの章立てに沿ってスライドを作成しています
    が、時間の都合上、内容を抜粋しています
    - スライドの文字数を減らしたいという理由で、英語表記も省略
    しているものが多いです

    View Slide

  3. アジェンダ
    - Chapter1: 統計的因果推論の基礎の基礎
    - Chapter2: 潜在的結果変数の枠組み

    View Slide

  4. Chapter1
    ~統計的因果推論の基礎の基礎~

    View Slide

  5. 相関は因果と同じではない
    はじめに
    アイスがよく売れる日には、人が溺れる事故が増える → 相関はあるが因果はない
    「気温」という第3の変数(交絡因子)
    気温が高いとアイスが
    たくさん売れる
    気温が高いと海水浴場
    で溺れる人が増える

    View Slide

  6. 統計的因果推論の考え方を学ぶための具体例
    インターネット広告と売上高の関係
    ナイーブな比較 “理想的な”比較
    広告の効果 = 2000 - 1500 = 500 ? 広告の効果 = 2000 - 1900 = 100 !!
    観測不可
    差分の400は広告の有無とは無関係

    View Slide

  7. 統計的因果推論とは
    因果関係(原因と結果の関係)をデータに基づいて推論すること
    因果関係の2つの議論
    効果をもたらした原因
    (cause of effect)
    原因がもたらした効果
    (effect of cause)
    A B


    因果の向きを特定 因果の効果を定量化
    A B
    どれくらい?
    定性的研究(フィールドワークなど) 定量的研究(統計的因果推論など)
    相補的

    View Slide

  8. 反事実モデル(1/2)
    観測されなかった「事実」すなわち「反事実」について考える
    アスピリンを飲んだから、頭痛が治った
    事実 反事実(反実仮想)
    ※ここでは、破線の向きは因果の向きではなく時間の流れを表しています

    View Slide

  9. 反事実モデル(2/2)
    難しい議論
    彼女は女の子だから、髪が長い
    事実 反事実(反実仮想)
    「女の子」の反事実「女の子でない」を容易に一意に定めることはできない
    戸籍上、男です
    生物学上、男です

    View Slide

  10. 操作なくして因果なし
    さまざまな見解があるので、Imbens and Rubin(2015, p21)を紹介
    「操作は実際に行われる必要はなく、因果効果を適切に定義するた
    めに、思考実験を行うことができればよい」
    実験研究
    人間が処置を実際に操作できる研究
    (処置を無作為割付け(後述))
    観察研究
    人間が処置を実際に操作できない研究
    (処置を無作為割付けしていない)
    統計的因果推論の目標「観察研究において実験研究と同様に因果推論できること」

    View Slide

  11. Rubin流とPearl流の因果推論
    統計的因果推論の2大巨頭
    Rubin流
    潜在的結果変数の枠組み
    (本書のテーマ)
    Pearl流
    構造的因果モデルの枠組み
    (DAGとか構造方程式とか)
    最近では、構造的因果モデルと機械学習を融合した「統計的因果探索」とかも
    実務で利用されてたりします(LiNGAMとか)
    対立的なものではなく、あくまでも相補的な関係

    View Slide

  12. Chapter2
    ~潜在的結果変数の枠組み~

    View Slide

  13. はじめに
    潜在的結果変数の枠組みでは、
    因果推論は「欠測データの問題」として扱われる
    氏名
    広告を見た
    場合の売上
    広告を見ていない
    場合の売上
    A 1,000 0
    B 1,500 1,000
    C 500 500
    氏名
    広告を見た
    場合の売上
    広告を見ていない
    場合の売上
    A 1,000 欠測
    B 欠測 1,000
    C 欠測 500
    欠測していないデータ 欠測しているデータ

    View Slide

  14. 潜在的結果変数の枠組み: 具体例(1/5)
    数学の試験の例: 補習授業の効果を考える
    設定
    入学試験の点数に応じて、学生は補習授業を受けるか受けないかが決まる
    補習授業が数学力の向上にどれだけ影響を与えているかを知りたい
    期末試験の点数をどのように比較すれば、補習授業の効果を推定できるか?

    View Slide

  15. 潜在的結果変数の枠組み: 具体例(2/5)
    データの確認
    変数pathには、ファイル「data02.csv」のPathを指定してください。
    ファイルは下記URLからダウンロードできます。
    https://www.kyoritsu-pub.co.jp/book/b10011781.html

    View Slide

  16. ありがちなミスリーディング(1): 前後比較
    潜在的結果変数の枠組み: 具体例(3/5)
    効果はマイナス...? → おそらくNo
    入学試験より期末試験の方が難易度が高かっただけと考えるのが自然

    View Slide

  17. 潜在的結果変数の枠組み: 具体例(4/5)
    ありがちなミスリーディング(2): ナイーブな比較
    やっぱり効果はマイナス...? → たぶんNo
    入学試験の点数が高い人たちはもともと数学力が高い可能性

    View Slide

  18. 潜在的結果変数の枠組み: 具体例(5/5)
    潜在的結果変数の枠組みによる比較
    平均すると10点近い効果があったみたい!
    実際には潜在的結果変数は観測できないため、いろいろ工夫する必要あり

    View Slide

  19. 潜在的結果変数の枠組み: 理論
    Y
    i
    : 結果変数, T
    i
    : 処置変数
    実際に観測される結果
    処置0の結果
    処置1の結果
    観測不可

    View Slide

  20. 処置効果1: 個体因果効果(ICE)
    個体間における効果。個体処置効果(ITE)とも呼ばれ、以下のよう
    に表される。
    τ
    i
    = Y
    i
    (1) - Y
    i
    (0)

    View Slide

  21. 処置効果2: 平均因果効果(ACE)
    母集団における平均的な効果。平均処置効果(ATE)とも呼ばれ、以
    下のように表される。
    τ
    ATE
    = E[Y
    i
    (1) - Y
    i
    (0)] = E[Y
    i
    (1)] - E[Y
    i
    (0)] … (2.4)

    View Slide

  22. 処置効果3: 処置群の平均処置効果(ATT)
    処置が割付けられた対象にどれくらい影響があったのかという処置
    効果であり、以下のように表される。
    τ
    ATT
    = E[Y
    i
    (1)-Y
    i
    (0)|T=1] = E[Y
    i
    (1)|T=1]-E[Y
    i
    (0)|T=1] … (2.5)
    Pythonの実行結果

    View Slide

  23. 交絡因子
    処置の割付けと結果変数の両方に影響を与えている変数
    数学の試験の例
    補習授業の受講
    期末試験の得点
    入学試験の得点
    交絡因子

    View Slide

  24. 方向付き非巡回グラフ: DAG
    変数同士の関係を矢印を用いて視覚的に表現したもの(ざっくり)
    DAGのイメージ
    2つの重要なDAGの定義
    - 有向性(directed)
    矢印の方向性がある
    - 非巡回(acyclic)
    グラフにおいて、ループが形成さ
    れていない
    数学の試験の例
    入学試験の
    得点
    補習授業の
    受講
    期末試験の
    得点
    実務でもDAGを描くのはめちゃめちゃ大事です!!!

    View Slide

  25. 無作為抽出と無作為割付け
    観測されない交絡を統制する1番良い方法は無作為割付け
    無作為抽出法 無作為割付け
    標本
    処置群 統制群
    母集団
    標本
    均質
    (推定可能)
    均質(比較可能)
    2つの集団の均質性が確率的に保証される(定量的に評価できる)
    注意: 無作為抽出法≠無作為割付け

    View Slide

  26. 内的妥当性と外的妥当性
    研究の評価には、2つの妥当性がある
    数学の試験の例
    内的妥当性 外的妥当性
    補習授業を受けた学生の集団1に
    おける標本Aの平均的な効果
    補習授業を受けた学生の集団1に
    おける標本Bの平均的な効果
    補習授業を受けたA大学の学生の
    集団の平均的な効果
    補習授業を受けたB大学の学生の
    集団の平均的な効果
    効果を”正しく”推定できたとしても、他の集団でも妥当かどうかは考察が必要

    View Slide

  27. Appendix

    View Slide

  28. グレンジャー因果性がある場合
    ざっくり言うと「モデルの予測精度を改善する→因果」と定義
    ARモデル: Y
    t
    =b
    0
    +b
    1
    Y
    t-1
    +u
    t
    VAR(1)モデル: Y
    t
    =b
    10
    +b
    11
    Y
    t-1
    +b
    12
    X
    t-1
    +u
    1t
    , X
    t
    =b
    20
    +b
    21
    Y
    t-1
    +b
    22
    X
    t-1
    +u
    2t
    とし、ある予測期間hにおけるモデルの平均2乗予測誤差をMSFE(h)とすると、
    MSFE
    Y, VAR(1)
    (h) < MSFE
    Y, AR
    (h)
    グレンジャー因果性
    X
    t
    を含めたVARモデルの予測精度 X
    t
    を含めないVARモデルの予測精度
    >

    View Slide

  29. SUTVA(Stable Unit Treatment Value Assumption)
    SUTVA: Stable Unit Treatment Value Assumption
    因果推論を可能とするための重要な仮定
    相互干渉がない 個体に対する隠れた処置がない
    (e.g)補習を受けた学生が補習を受け
    ていない学生に教える
    (e.g)学生Aと学生Bで受講する補習授
    業の内容が異なる
    (2.1)式という表現はSUTVAを暗に受け入れていることが含意されている

    View Slide

  30. ExchangeabilityとPositivity
    観察データで因果推論する際に必要な2つの前提条件
    Conditional ExchangeabilityとConditional Positivity
    Conditional Exchangeability
    共変量Xで条件づけた際に、潜在
    的結果変数{Y(1), Y(0)}と割付けT
    が独立
    {Y
    i
    (1), Y
    i
    (0)} ⊥ T
    i
    | X
    Conditional Positivity
    共変量Xで条件づけた際に、処置
    の割付け確率が0より大きく1より
    小さい
    0 < Pr(T=1|X) < 1
    SUTVA+この2つの仮定が成り立つ=強い無視可能性(strong ignorability)

    View Slide

  31. - 因果関係: causality
    - 原因: cause(cf. 処置: treatment, 介入: intervention)
    - 結果: outcome
    - 効果: effect
    - 反事実(反実仮想): counterfactual
    - 潜在的結果変数: potential outcome
    - 操作なくして因果なし: no causation without manipulation
    - DAG: Direct Acyclic Graph
    用語の英訳対応(出現順)

    View Slide

  32. 用語の英訳対応(出現順)
    - 処置群: treatment group
    - 統制群: contorol group(cf. 対照群)
    - 割付け: assignment(cf. 割当て)
    - 個別因果効果: ICE(Individual Causal Effect)
    - 個別処置効果: ITE(Individual Treatment Effect)
    - 平均因果効果: ACE(Average Causal Effect)
    - 平均処置効果: ATE(Average Treatment Effect)
    - ATT: Average Treatment effect on the Treated
    - 交絡: confounding
    - 無作為抽出法: random sampling
    - 内的妥当性: internal validity
    - 外的妥当性: external validity

    View Slide

  33. 参考文献
    - 岩崎(2015)「統計的因果推論」朝倉書店
    - 小川(2021)「Pythonによる因果分析」マイナビ出版
    - 沖本(2010)「経済・ファイナンスデータの計量時系列分析」朝倉書店
    - 落合[訳](2019)「入門統計的因果推論」朝倉書店
    - 小林[訳](2019)「政策評価のための因果関係の見つけ方」日本評論社
    - 高橋(2022)「統計的因果推論の理論と実装」共立出版
    - 西山他(2019)「計量経済学」有斐閣
    - 星野(2009)「調査観察データの統計科学」岩波書店
    - 安井(2020)「効果検証入門」技術評論社

    View Slide

  34. ご清聴ありがとうございました

    View Slide