Upgrade to Pro — share decks privately, control downloads, hide ads and more …

統計的因果推論、構造から見るか? 差分から見るか?:非巡回有向グラフ(DAG)、潜在反応モデル、そして構造的 (関数)因果モデルによる両者の統合的理解

takehikoihayashi
December 21, 2020
12k

統計的因果推論、構造から見るか? 差分から見るか?:非巡回有向グラフ(DAG)、潜在反応モデル、そして構造的 (関数)因果モデルによる両者の統合的理解

応用数理学会ものづくり研究会(2020/12/18)で発表機会をいただいた、「因果推論の諸理論の統合的理解」をテーマとした発表です。Rubinの潜在反応モデルとPearlの構造的因果モデルの統合的理解がテーマです。(大きなテーマを60分枠に詰め込んだので、ややギチギチした作りになっています。大部分は過去の発表のマッシュアップですが、統合的理解のところの説明はちょっとアップデートされています)

takehikoihayashi

December 21, 2020
Tweet

More Decks by takehikoihayashi

Transcript

  1. 応⽤数理ものづくり研究会 第35回 技術セミナー@オンライン 2020/12/8
    @国⽴環境研究所 環境リスク・健康研究センター
    林岳彦
    統計的因果推論、構造から⾒るか?
    差分から⾒るか?
    ⾮巡回有向グラフ(DAG)、潜在反応モデル、そして構造的
    (関数)因果モデルによる両者の統合的理解

    View full-size slide

  2. ⾃⼰紹介|どんな研究をしているのか
    ⽣態リスク評価、確率的リスク分析、因果推論
    Yij
    θAlgae
    σj
    Means SD
    θFish
    Sensitivity differences among
    taxonomic groups Normal distributions
    Log(NOEC)
    Parameters were estimated
    by MCMC simulations
    θInvertebrate
    階層ベイズモデルとモンテカルロシミュレーションを
    ⽤いた化学物質の⽣態リスクの定量化とリスク⽐較
    Hayashi & Kashiwagi (2009)
    Hayashi & Kashiwagi (2010)
    Monte Carlo Analysis
    EPAF = F
    µ
    ECD
    - µ
    SSD
    s
    ECD
    2 + s
    SSD
    2
    æ
    è
    ç
    ç
    ö
    ø
    ÷
    ÷
    µ
    ECD
    µ
    SSD
    s
    ECD
    s
    SSD
    Calculation of predictive
    distribution of EPAF
    Posterior distributions of ECD
    parameters
    Posterior distributions of SSD
    parameters
    Results: Quantitative Risk Comparison
    Median and 90% range of EPAF
    log10(EPAF)
    Large Risk→
    ←Small Risk
    Chemicals
    Ammonia
    Copper
    Nickel
    Zinc
    Hayashi and Kashiwagi (2011)

    View full-size slide

  3. ⾃⼰紹介|どんな研究をしているのか
    『はじめてのバックドア基準』
    (Pearlの関数的因果モデルの解説)
    ⽣態リスク評価、確率的リスク分析、因果推論
    ネオニコチノイド系農薬の
    ⾚トンボへの影響の因果推論
    !",$
    =
    &",$
    − &"(),$
    &"(),$
    = +)
    ,-./),"
    − ,-./),"()
    + ⋯ + +2
    ,-./2,"
    − ,-./2,"()
    ++"
    3-45"
    + 6)
    7),"
    + ⋯ + 68
    78,"

















    背景知識からの因果モデルの構築
    バックドア基準に基づく
    統計モデルの構築
    因果効果の推定
    Takeshita et al. (2020)など

    View full-size slide

  4. ⾃⼰紹介|どんな研究をしているのか
    『はじめてのバックドア基準』
    (Pearlの関数的因果モデルの解説)
    ⽣態リスク評価、確率的リスク分析、因果推論
    ネオニコチノイド系農薬の
    ⾚トンボへの影響の因果推論
    !",$
    =
    &",$
    − &"(),$
    &"(),$
    = +)
    ,-./),"
    − ,-./),"()
    + ⋯ + +2
    ,-./2,"
    − ,-./2,"()
    ++"
    3-45"
    + 6)
    7),"
    + ⋯ + 68
    78,"

















    背景知識からの因果モデルの構築
    バックドア基準に基づく
    統計モデルの構築
    因果効果の推定
    Takeshita et al. (2020)など
    Problem/issue-driven (not methodology-driven)
    の研究者による
    因果推論のユーザー視点から⾒た
    因果推論の理論的側⾯についての話
    数理的には物⾜りないかもしれませんがご容赦ください
    本⽇の話について:

    View full-size slide

  5. 解題
    (イントロとして)

    View full-size slide

  6. 因果推論
    I. 解題
    どれも「因果推論」としかいいようがないし
    そもそもぜんぶ奥で繋がってる
    どの入口が本物の「因果推論」か?
    どの入口が最も優れた「因果推論」か?
    統計的因果推論の3つの⼊り⼝
    Pearl口
    Rubin口
    Robins口
    ぱっと⾒の外観は
    それぞれ個性的
    特定の⽬的の上では
    どれが良いかという
    議論はありうるけど
    端的に⾔って愚問である

    View full-size slide

  7. I. 解題
    本⽇の話:「構造」と「差分」の視点の統合
    「対象を理解すること」にとって
    統計的因果推論とは何か?
    Issue-drivenの分析者はこういうことを考えることがままあると思う
    ⾮巡回有向グラフ(DAG)
    潜在反応モデル
    構造的因果モデル
    = + ( − )
    X
    Y
    Z1
    Z2
    Z3
    Average Causal Effect = [] − []
    :
    = :
    :
    , :
    = 1, … ,
    「因果とは差異である」 「因果とは構造である」

    View full-size slide

  8. I. 構造から⾒た因果推論
    :DAGとバックドア基準の⼊⾨
    II. 差分から⾒た因果推論
    :潜在反応モデル⼊⾨
    III. 構造的因果モデル(SCM)による統合
    (1) 因果グラフのSCMによる表現
    (2) 潜在反応モデルのSCMによる表現
    (3) 潜在反応モデルとDAGとの繋がり
    IV. 差分と構造の統合 --- Issueの総合的理解へ
    本⽇の⽬次

    View full-size slide

  9. バックドア基準は、背景にある因果構造を基に「バ
    イアスのない因果効果推定」のためにはどの変数を
    考慮するべきかの理論的条件を与える
    (Preview) 本⽇の話の全体まとめ

    潜在反応モデルは「潜在反応の差分」として因果効
    果を定式化し、因果効果推定の解析プロトコルへの
    明瞭な⾒通しを与える

    構造的因果モデルは⾮常に広いクラスの因果効果推
    定アプローチを包含しうるものであり、issueの総合
    的理解へ向けた統計的/理論的/理念的な
    perspectiveの基盤となりうる

    1時間枠で⾏けるところまで⾏ければ
    “統計レシピ”ではなくレシピの裏側にある”考え⽅”に関する話

    View full-size slide

  10. 導⼊|相関と因果は違う
    散布図上の相関関係からの素朴な予測や期待と
    因果効果(介⼊効果)がズレることがある

    『X→Yの介⼊効果』=
    Xを1単位量分だけ介⼊により変化させたときの
    Yの平均的な変化量
    【本⽇の発表の中での定義】

    View full-size slide

  11. 導⼊|相関と因果は違う
    散布図上の相関関係からの素朴な予測や期待と
    因果効果(介⼊効果)がズレることがある

    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    p < 0.001

    View full-size slide

  12. 導⼊|相関と因果は違う
    散布図上の相関関係からの素朴な予測や期待と
    因果効果(介⼊効果)がズレることがある

    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    p < 0.001
    「Xが⼩さいとき、Yは⼤きい」
    (=相関関係がある)とほぼ確実に⾔える
    「Xを⼩さくすると、Yは⼤きくなる」
    (=因果関係がある)と⾔えるか?

    View full-size slide

  13. 導⼊|相関と因果は違う
    もしXとYの相関が「Xと関係ない要因」で⽣じ
    ているならば、Xを減少させてもYは回復しない

    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    ԼྲྀҬ
    ্ྲྀҬ

    View full-size slide

  14. 導⼊|相関と因果は違う
    もしYの状態がXにより⽣じているならば、Xを
    減少させればYは回復する

    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    ԼྲྀҬ
    ্ྲྀҬ

    View full-size slide

  15. 導⼊|相関と因果は違う
    もしYの状態がXにより部分的に⽣じているなら
    ば、Xを減少させればYは部分的に回復する

    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    ԼྲྀҬ
    ্ྲྀҬ

    View full-size slide

  16. 導⼊|相関と因果は違う
    もしYの状態がXにより部分的に⽣じているなら
    ば、Xを減少させればYは部分的に回復する

    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    ԼྲྀҬ
    ্ྲྀҬ
    「Xを⼩さくすると、Yは⼤きくなる」かは
    Yの状態が何によって⽣じているかに依存する

    View full-size slide

  17. 導⼊| 相関と因果で必要とされる⽅法論が違う
    「Xが⼩さいとき、Yは⼤きい」か?
    ∈「相関関係(association)」についての問い
    p(Y|X=⼩さい)
    やるべきこと:Xが⼩さいときのYの計算
    ←所与の数値のみから計算できる
    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    p < 0.001

    View full-size slide

  18. 導⼊|相関と因果で必要とされる⽅法論が違う
    「Xを⼩さくすると、Yは⼤きくなる」か?
    ∈「因果的影響(causal effect)」についての問い
    p(Y|X=do(⼩さい))
    やるべきこと:Xを⼩さくしたときのYの計算
    ←計算に因果的情報が必要
    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    ԼྲྀҬ
    ্ྲྀҬ

    View full-size slide

  19. 導⼊|相関と因果で必要とされる⽅法論が違う
    p(Y|X=⼩さい)
    Xが⼩さいときのYの計算
    p(Y|X=do(⼩さい))
    Xを⼩さくしたときのYの計算
    因果の問題
    相関の問題
    p(Y|X=see(⼩さい))
    あるいは、いうなれば
    なぜズレるの?
    交絡のせい! 内⽣性のせい!
    ⼀歩込み⼊った議論をする際に判断に迷うことがある
    本章の
    ⽬標
    「バックドアパスが開いているせい」
    「バックドア基準が満たされていないせい」
    という説明の仕⽅・概念を理解する
    association

    View full-size slide

  20. 前置き|バックドア基準は「何について」の話?

    例えば、重回帰モデルの場合
    モデルに追加された説明変数の組が「X→Y」についてバックドア基準を満
    たすとき、重回帰分析から得られたXの偏回帰係数をそのまま「X→Yの介
    ⼊効果」のバイアスのない推定量とみなせる
    例えば、「シンプソンのパラドックス」(ここでは、どの変数で層別化す
    るかによって推定結果が変るケースの意味で⽤いる)が⽣じている場合
    興味の対象となる「処理X→結果Y」についてバックドア基準を満たす変数
    で層別化して解析すれば「X→Yの介⼊効果」をバイアスなく推定できる
    具体的には、バックドア基準を満たすと:
    *データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です
    バックドア基準は介⼊効果推定での変数選択の基準
    をもたらす

    View full-size slide

  21. 今⽇の話| バックドア基準とは?(ざっくり)
    “バックドア基準が満たされている”

    “バックドアパス”って何?
    “開く/閉じる”ってどういうこと?
    + (2) 処理X→結果Yの道がブロックされていない
    (1) 開きっぱなしのバックドアパスがない

    “ブロック”って何?

    View full-size slide

  22. 今⽇の話| バックドア基準とは?(ざっくり)
    “バックドア基準が満たされている”

    “バックドアパス”って何?
    “開く/閉じる”ってどういうこと?
    + (2) 処理X→結果Yの道がブロックされていない
    (1) 開きっぱなしのバックドアパスがない

    “ブロック”って何?

    View full-size slide

  23. 超ざっくり説明|”バックドアパス”とは?
    n 因果構造を丘にある「⼈⼯池」でイメージする
    迂遠かもしれませんが、因果の「流れ」のアナロジーと
    して有効だと思うので少々お付き合いいただければ・・
    X
    Y
    *降⾬の影響などは考えない
    本講演を通して
    X: 処理
    Y: 結果
    Z: 共変量
    で表記します

    Y=βX+γ+ε
    ⼈⼯池
    ⼈⼯池
    ⽔路

    View full-size slide

  24. 超ざっくり説明|”バックドアパス”とは?
    n ⽤語説明:⾮巡回有向グラフ
    DAG⾃体は⾮常に広いクラスのモデルを表現しうる。たとえば、原理的には、時系列
    的なsequentialな数値シミュレーションを書ける系はDAGの形で描ける
    X
    Y
    “親”
    “⼦”
    “祖先”
    “⼦孫”
    (Directed Acyclic Graph; DAG)
    ;<=
    ;
    ;>=
    ;<=
    ;
    ;>=
    状態空間モデルの例

    View full-size slide

  25. 超ざっくり説明|”バックドアパス”とは?
    「バックドアパス」=『処理Xと結果Yの上
    流側にある両者に影響を与える流れ』

    X
    Y
    Z1
    Z2
    (X→Yの)
    バックドアパス
    上流側にある「Z1」に
    インクをぶちまけると
    XにもYにも到達する
    (=両者に影響を与える)

    View full-size slide

  26. 超ざっくり説明|”バックドアパス”とは?
    「バックドアパス」=『処理Xと結果Yの上
    流側にある両者に影響を与える流れ』

    X
    Y
    Z1
    Z2
    (X→Yの)
    バックドアパス
    ではない!
    上流側にある「Z1」に
    インクをぶちまけても
    Yにしか到達しない
    (=両者には影響を与えない)

    View full-size slide

  27. 超ざっくり説明|”バックドアパス”とは?
    「バックドアパス」=『処理Xと結果Yの上
    流側にある両者に影響を与える流れ』

    X
    Y
    Z1
    Z2
    (X→Yの)
    バックドアパス
    ではない!
    上流側にある「Z1」に
    インクをぶちまけても
    Xにしか到達しない
    (=両者には影響を与えない)
    *Xそのものを通してYへ繋がる
    流れはノーカウント

    View full-size slide

  28. 超ざっくり説明|”バックドアパス”とは?
    「バックドアパス」=『処理Xと結果Yの上
    流側にある両者に影響を与える流れ』

    X
    Y
    Z1
    Z2
    (X→Yの)
    バックドアパス
    上流側にある「Z1」に
    インクをぶちまけると
    XにもYにも到達する
    (=両者に影響を与える)

    View full-size slide

  29. 超ざっくり説明|バックドアパスの何が問題?
    上流側の変動に伴い”シンクロ”が⽣じる

    X
    Y
    Z
    X
    Y
    Zの変動によりX-Y間に
    "シンクロ"が⽣じる
    Zが⼤
    Zが⼩
    (X→Yの)
    バックドアパス
    このZの変動によるシンクロが”疑似相関”を⽣み、
    X→Yの介⼊効果の推定にバイアスをもたらす
    ⾮因果的
    連関

    View full-size slide

  30. 超ざっくり説明|バックドアパスの何が問題?
    参考:バックドアパスがない場合の例

    X
    Y
    Z
    X
    Y
    Zの変動でX-Y間に
    “シンクロ”は⽣じない
    Zが⼤
    Zが⼩
    バックドアパスがないとき、Zの変動はバイアス・
    擬似相関の原因とならない

    View full-size slide

  31. 今⽇の話| バックドア基準とは?(ざっくり)
    “バックドア基準が満たされている”

    “バックドアパス”って何?
    “開く/閉じる”ってどういうこと?
    + (2) 処理X→結果Yの道がブロックされていない
    (1) 開きっぱなしのバックドアパスがない

    “ブロック”って何?

    View full-size slide

  32. 超ざっくり説明|バックドアパスが”閉じる”とは?
    バックドアパスが”閉じる”=バックドアパス
    上の変数を”固定”する

    X
    Y
    Z
    Zを“固定”する
    バックドアパスが”閉じ”
    交絡の影響が消える
    シンクロを⽣む流れが
    “ブロック”される
    Zで層別化して解析
    重回帰分析の共変量としてZをモデルに追加
    “固定”= 条件付けconditioning の⼿法の例


    View full-size slide

  33. 超ざっくり説明|バックドアパスが”閉じる”とは?
    参考:Zでの層別化(X:汚染濃度, Y:種数, Z:流域)

    「上流」「下流」の層別に
    X→Yの効果を計算して集計する
    Z:流域
    X:汚染
    濃度
    Y:種数
    流域Zを層別化により”固定”し解析することで交絡
    の影響が消え、介⼊効果がバイアスなく推定できる
    ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9




    ͷ


    :
    ԼྲྀҬ
    ্ྲྀҬ

    View full-size slide

  34. 超ざっくり説明|パスが”開きっぱなし”とは?
    バックドアパスが開きっぱなし=変数が固定
    されずパスの流れが”ブロック”されていない

    X
    Y
    Z
    X
    Y
    Zの変動によりX-Y間に
    "シンクロ"が⽣じる
    Zが⼤
    Zが⼩
    (X→Yの)
    バックドアパス
    ⾮因果的
    連関
    介⼊効果の推定のバイアスが調整されぬまま残る

    View full-size slide

  35. 超ざっくり追記|固定により”開く”こともある
    合流点を固定すると、“親”の間に双⽅向
    パスが開く

    バックドアパスが
    “開いた”状態
    X
    Y
    Z
    (X→Yの)
    バックドアパス



    バックドアパスの
    ない状態
    X
    Y
    Z
    Zを“固定
    “⼦はかすがい”

    View full-size slide

  36. 超ざっくり追記|固定により”開く”こともある
    参考:合流点となる「合否」を”固定”





    Z:合否
    Y:実技
    試験
    美⼤の⼊学試験における仮想例
    合格者 Z=1
    不合格者 Z=0
    X:学⼒
    試験
    100
    100
    学⼒試験





    View full-size slide

  37. 超ざっくり追記|固定により”開く”こともある
    参考:合流点となる「合否」を”固定”





    Z:合否
    Y:実技
    試験
    美⼤の⼊学試験における仮想例
    合否Zで層別化すると、XとYの間に⾮因果的な連関
    が⽣じ、X→Yの介⼊効果の推定にバイアスが⽣じる
    合格者 Z=1
    不合格者 Z=0
    X:学⼒
    試験
    100
    100
    学⼒試験





    View full-size slide

  38. 内容の説明| バックドア基準とは?(概要版)
    “バックドア基準が満たされている”

    “バックドアパス”って何?
    “開く/閉じる”ってどういうこと?
    + (2) 処理X→結果Yの道がブロックされていない
    (1) 開きっぱなしのバックドアパスがない

    “ブロック”って何?

    View full-size slide

  39. 超ざっくり説明| ”X→Yの道がブロックされてない”
    Zが中間点の場合は”固定”してはいけない

    Z
    Y
    X
    X
    Y
    Zを"固定"しなければ、何の問題も⽣じない

    View full-size slide

  40. 超ざっくり説明| ”X→Yの道を閉じるな”
    中間点をZを固定すると、Xからの「介⼊効
    果」の流れ⾃体がブロックされてしまう
    ("overconditioning")

    在来種Aを護るための
    外来種Bの駆除の効果(仮想例)
    Z:外来種B
    の根絶
    Y:在来種A
    の個体数
    X:外来種B
    の駆除努⼒
    外来種Bの駆除努⼒



    A




    View full-size slide

  41. 超ざっくり説明| ”X→Yの道を閉じるな”
    中間点をZを固定すると、Xからの「介⼊効
    果」の流れ⾃体がブロックされてしまう
    ("overconditioning")

    在来種Aを護るための
    外来種Bの駆除の効果(仮想例)
    Z:外来種B
    の根絶
    Y:在来種A
    の個体数
    X:外来種B
    の駆除努⼒
    外来種Bの駆除努⼒



    A




    छBͷࠜઈʹ੒ޭ(Z=1)
    छBͷࠜઈʹࣦഊ(Z=0)

    View full-size slide

  42. 内容の説明| バックドア基準とは?(概要版)
    “バックドア基準が満たされている”

    “バックドアパス”って何?
    “開く/閉じる”ってどういうこと?
    + (2) 処理X→結果Yの道がブロックされていない
    (1) 開きっぱなしのバックドアパスがない

    “ブロック”って何?

    View full-size slide

  43. 具体例でおさらい|3変量(X, Y, Z)の場合
    3変量で⾒る”ほぼ
    バックドア基準”

    X
    Y
    Z
    )
    X
    Y
    Z
    )
    X
    Z
    Y
    ( )
    Zを加えよ Zを加えるな
    *3変量の場合では、巷の”rule-of-thumb”的な変数選択
    ルール以上のご利益はあまり感じられないかも

    View full-size slide

  44. 具体例でおさらい|4変量の場合
    4変量以上だと「道」を考える必要がある

    X
    Y
    Z1
    Z2 もし処理Xと結果Yの「両者の共通
    原因」を”交絡変数”と呼ぶ場合
    Z2は”交絡変数”かつ分岐点
    Z1は”交絡変数”と呼ばれない
    必ずモデルに追加すべき?
    モデルに追加しなくてよい?
    common cause
    *Z2は観測不可能、Z1は観測済み
    のときどうする?

    View full-size slide

  45. 具体例でおさらい| 4変量の場合
    変数ベースではなく”道“の開閉がキモ

    このどの場合もバックドアパスは閉じられている
    *どのケースもXとYの"シンクロ"の原因となりうる上流側の流れが遮断されている
    X
    Y
    Z2
    Z1 X
    Y
    X
    Y
    Z1
    Z2 Z2
    Z1

    View full-size slide

  46. 4変量以上の場合|本質は”道”にあり
    4変量以上の”道”:合流点の例

    Z1
    X
    Z2
    Y
    Z3
    Z1
    X Y
    Z3
    X
    Z2
    Y
    Z3
    X→Y


    Z1
    Z2
    X Y
    Z3
    Z1 Z2
    バックドアパスが
    "開いている"
    バックドアパスは"閉まっている"
    バックドアパスの”道”がブロック
    されていることが肝要

    View full-size slide

  47. 4変量以上の場合|本質は”道”にあり
    4変量以上の”道”:中間点の場合

    X
    Y
    Z2
    Z1
    Z1, Z2は中間点
    絶対にモデルに追加
    したらダメ?
    中間点を⼊れるとXからの
    因果効果⾃体が
    ブロックされてしまうのでダメ!
    (これは3変量の場合と同様)

    View full-size slide

  48. 4変量以上の場合|本質は”道”にあり
    4変量以上の”道”:中間点の場合

    X
    Y
    Z1
    Z2
    X
    Y
    X
    Y
    Z2
    Z1 Z1
    Z2

    View full-size slide

  49. 4変量以上の場合|本質は”道”にあり
    4変量以上の”道”:中間点の場合

    X
    Y
    Z1
    Z2
    全体としてX→Yの因果の"道"がブロックされないことが肝要
    X
    Y
    X
    Y
    Z2
    Z1 Z1
    Z2

    View full-size slide

  50. 4変量以上の場合|まとめ
    X
    Y
    Z2
    Z1 X
    Y
    X
    Y
    Z1
    Z2 Z2
    Z1
    X
    Y
    Z1
    Z2
    X
    Y
    X
    Y
    Z2
    Z1 Z1
    Z2
    バックドアパス
    をブロックしろ
    X→Yの道を
    ブロックするな
    もうほとんどバックドア基準
    細かい論点をのぞけば
    畢竟, 以下2つのメッセージに集約される

    View full-size slide

  51. "まとめ"としてのバックドア基準
    教科書内の「バックドア基準」を解読してみよう
    ⿊⽊学(2017)『構造的因果モデルの基礎』 p99より引⽤

    View full-size slide

  52. ステップ6 | "まとめ"としてのバックドア基準
    教科書内の「バックドア基準」を解読してみよう
    ⿊⽊学(2017)『構造的因果モデルの基礎』 p99より引⽤

    1. XからZの任意の要素に有向道がない
    2. GよりXから出る⽮線(X→)を除いたグラフにおいて、
    ZがXとYを有向分離する
    定義 3-5 バックドア基準(back door criterion)
    “逆”のケース(XがYの下流)ではない
    ⾮巡回的有向グラフGにおいてXはYの⾮⼦孫である。このとき、次
    の2条件を満たす頂点集合Zは、(X, Y)についてバックドア基準を
    満たすという
    例:中間変数や下流の合流点
    Xの下流の共変量をモデルに加えてはいけない
    バックドアパスがブロックされている

    View full-size slide

  53. 4変量以上の場合|まとめ(再掲)
    X
    Y
    Z2
    Z1 X
    Y
    X
    Y
    Z1
    Z2 Z2
    Z1
    X
    Y
    Z1
    Z2
    X
    Y
    X
    Y
    Z2
    Z1 Z1
    Z2
    バックドアパス
    をブロックしろ
    X→Yの道を
    ブロックするな
    もうほとんどバックドア基準
    ものすごい細かい論点をのぞけば
    畢竟, 以下2つのメッセージに集約される

    条件(1)に対応
    条件(2)に対応

    View full-size slide

  54. 例題その1|どの変数を加えれば良い?
    X
    Y
    Z1
    Z2
    Z3

    View full-size slide

  55. 例題その1|どの変数を加えれば良い?
    X
    Y
    Z1
    Z2
    Z3
    Z1にインクをぶちまけると
    XとYの両⽅にインクは到達する
    バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
    ぶちまけたらどうなるか」を考えてみよう!

    View full-size slide

  56. 例題その1|どの変数を加えれば良い?
    バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
    ぶちまけたらどうなるか」を考えてみよう!
    X
    Y
    Z1
    Z2
    Z3
    Z2にインクを
    ぶちまけると
    XとYの両⽅に
    インクは到達する

    View full-size slide

  57. 例題その1|どの変数を加えれば良い?
    バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
    ぶちまけたらどうなるか」を考えてみよう!
    X
    Y
    Z1
    Z2
    Z3
    Z2からは
    こういう
    経路もある

    View full-size slide

  58. 例題その1|どの変数を加えれば良い?
    バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
    ぶちまけたらどうなるか」を考えてみよう!
    X
    Y
    Z1
    Z2
    Z3
    Z2からは
    この
    経路もある

    View full-size slide

  59. 例題その1|どの変数を加えれば良い?
    X
    Y
    Z1
    Z2
    Z3
    バックドアパスの⾒極めに迷ったら、もし「その⼈⼯池にインクを
    ぶちまけたらどうなるか」を考えてみよう!
    全部で4つの
    バックドアパス
    がある

    View full-size slide

  60. 例題その1|どの変数を加えれば良い?
    X
    Y
    Z3
    Z2
    Z1
    Z1, Z2をブロックすると3つの
    バックドアパスが全て遮断される
    バックドア基準を満たす最⼩の変数セットは「Z1, Z2」
    *「Z1, Z2, Z3」もバックドア基準を満たします

    View full-size slide

  61. 例題その2|どの変数を加えれば良い?
    X
    Y
    Z4
    Z3
    Z2
    Z5
    Z6
    Z1
    バックドア基準
    を満たす最⼩の
    変数セットは
    「Z1」
    *ここでZ5, Z6を⼊れると
    新たなバックドアパスが
    開いてしまう
    *Z4はそもそも
    中間点なので⼊れてはダメ
    Z1をブロックすると2つの
    バックドアパスが全て遮断される

    View full-size slide

  62. ⼀部が不明な場合|どの変数を加えれば良い?
    X
    Y
    Z1
    Z2
    この部分の
    因果構造は不明

    View full-size slide

  63. ⼀部が不明な場合|どの変数を加えれば良い?
    X
    Y
    Z1
    Z2
    この部分の
    因果構造は不明
    バックドアパスが
    ある場合、必ず
    Z1, Z2のどちらかを通る

    View full-size slide

  64. ⼀部が不明な場合|どの変数を加えれば良い?
    X
    Y
    Z1
    Z2
    この部分の
    因果構造は不明
    バックドアパスが
    ある場合、必ず
    Z1, Z2のどちらかを通る

    View full-size slide

  65. ⼀部が不明な場合|どの変数を加えれば良い?
    X
    Z1
    Z2
    この部分の
    因果構造は不明
    Y
    Z1, Z2をブロックすれば
    バックドアパスは
    遮断される

    View full-size slide

  66. ⼀部が不明な場合|どの変数を加えれば良い?
    X
    Z1
    Z2
    この部分の
    因果構造は不明
    Y
    「Z1, Z2」を加えればバックドア基準を満たす
    Z1, Z2をブロックすれば
    バックドアパスは
    遮断される
    ポイントとなる部分の適切な粒度の背景知識があればよい

    View full-size slide

  67. ⼀部が不明な場合|どの変数を加えれば良い?
    X
    Z1
    Z2
    この部分の
    因果構造は不明
    Y
    Z1, Z2をブロックすれば
    バックドアパスは
    遮断される
    ポイントとなる部分の適切な粒度の背景知識があればよい

    View full-size slide

  68. 補⾜|実験における無作為化との関係
    X Y
    Z1
    Z3 Z2
    Z5
    Z6 Z4
    So many
    バックドアパス
    実験はランダム⽣成機によりバックドアパスを閉じる

    View full-size slide

  69. 補⾜|実験における無作為化との関係
    X Y
    Z1
    Z3 Z2
    Z5
    Z6 Z4
    コイントス
    実験は”ランダム⽣成機”によりバックドアパスを閉じる

    View full-size slide

  70. 補⾜ |傾向スコアとの関係
    X Y
    Z1
    Z3 Z2
    Z5
    Z6 Z4
    e
    傾向スコアで
    まとめてブロック
    傾向スコアはバックドアパスをブロックする"合成変数"

    うまく適⽤できれば超強⼒な⼿法!

    View full-size slide

  71. (再掲) |バックドア基準は「何について」の話?

    例えば、重回帰モデルの場合
    モデルに追加された説明変数の組が「X→Y」についてバックドア基準を満
    たすとき、重回帰分析から得られたXの偏回帰係数をそのまま「X→Yの介
    ⼊効果」のバイアスのない推定量とみなせる
    例えば、「シンプソンのパラドックス」(ここでは、どの変数で層別化す
    るかによって推定結果が変るケースの意味で⽤いる)が⽣じている場合
    興味の対象となる「処理X→結果Y」についてバックドア基準を満たす変数
    で層別化して解析すれば「X→Yの介⼊効果」をバイアスなく推定できる
    具体的には、バックドア基準を満たすと:
    *データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です
    バックドア基準は介⼊効果推定での変数選択の基準
    をもたらす

    View full-size slide

  72. I. DAGとバックドア基準のまとめ
    “バックドア基準が満たされている”

    + (2) 処理Xの下流の変数が追加されていない
    (1) 開きっぱなしのバックドアパスがない

    変数ベースではなく”道”の開閉がキモ

    ・たとえ森羅万象が因果関係で繋がっていても、因
    果効果を識別可能とするために考えるべき局所的
    な因果構造と変数の範囲を理論的に限定できる
    ・傾向スコアもバックドアパスを閉じるための強⼒
    な⼿法(バックドア基準は理論的条件)
    介⼊効果がバイアスなく推定できる
    *データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です

    View full-size slide

  73. 林岳彦・⿊⽊学(2016)
    「相関関係」と「因果関係」は違います。これはよく知られています。ある要
    因 X ともうひとつの要因 Y のあいだに高い相関が見られたからといって,それ
    らのあいだに因果的な関係があるとは限りません。一方で,そのような高い相関
    を「因果関係」として解釈できる場合もたしかにあります。この辺りが難しいと
    ころです。もしあなたの同僚やクライアントが,あなたが作成した散布図を見て
    「相関関係」と「因果関係」を明らかに混同した発言をしはじめたとしましょう。
    このとき,
    「この場合はこれこれこうだからこの相関関係は因果関係として解釈
    できるんですよ/できないんですよ」と相手に向かって理路整然と説明するのは,
    それほど簡単なことではありません。こと因果関係の話になると,自分の頭の中
    でその内容を整理するのも,その内容を相手に伝わるように説明するのも,なか
    なか難しいものです。
    私たちの経験上,そんなときにとても役に立つのは,データの背後に想定して
    いる「因果構造(データ生成のメカニズム)」についての(分かる範囲での)簡単な
    ポンチ絵を丸と矢印で描いてみせることです[本稿ではそんなポンチ絵の例がたくさん
    出てきます]。そして,そのようなポンチ絵を描いたあとに,その描かれた因果構
    造が「あ















    」を満たしているかどうかを相手と共同で検討していき
    ます。多くの場合,その検討を通して「この相関関係は因果関係を示していると
    解釈してよいのか?」や「相関関係を因果関係として解釈するためには本来はど
    のようなデータが必要なのか?」といった本質的な問いについて,より明確かつ
    端的な議論ができるようになります。
    相関と因果と丸と矢印のはなし
    はじめてのバックドア基準
    林岳彦(国立環境研究所)・黒木学(統計数理研究所)
    [特集]因果推論 現実の課題に答える統計学
    参考⽂献 | バックドア基準の解説原稿 (本⽇の元ネタ)
    2016年6⽉発売「岩波データサイエンスvol. 3」因果推論特集号

    View full-size slide

  74. 参考⽂献 | バックドア基準の解説 (ガチ勢向け)

    View full-size slide

  75. 参考⽂献 | Pearlのやさしい本(昨年でた)
    Pearlが、⼀般向けに、
    やさしく書いている!
    (やさしく書かれているが
    けっこう深い/新しい
    内容まで書いてある)

    View full-size slide

  76. I. 構造から⾒た因果推論
    :DAGとバックドア基準の⼊⾨
    II. 差分から⾒た因果推論
    :潜在反応モデル⼊⾨
    III. 構造的因果モデル(SCM)による統合
    (1) 因果グラフのSCMによる表現
    (2) 潜在反応モデルのSCMによる表現
    (3) 潜在反応モデルとDAGとの繋がり
    IV. 差分と構造の統合 --- Issueの総合的理解へ
    本⽇の⽬次

    View full-size slide

  77. 潜在反応モデル⼊⾨|
    Neyman-Rubinの潜在反応モデルの考え⽅
    処理 = に対して、各個体は⼀意な(決定論
    的に定まる)潜在反応() をもつ
    (ぴかそ)
    ねこの健康状態Yに対する栄養補助食Xの影響の例
    ぴかそ
    だり
    X=0を「補助食なし」、X=1を「補助食あり」とする
    もし「ぴかそ」が
    「補助⾷あり」のときの
    「ぴかそ」の健康状態
    もし「だり」が
    「補助⾷なし」のときの
    「だり」の健康状態
    (だり)

    View full-size slide

  78. 潜在反応モデル⼊⾨|
    Neyman-Rubinの潜在反応モデルの考え⽅
    何が嬉しいかというと、因果効果を「処理間で
    の潜在反応の差」として定義できる
    X=0を「補助食なし」、X=1を「補助食あり」とする
    「ぴかそ」へのX→Yの因果効果の定義
    通常、この両者をともには観測できない
    “因果推論の根本問題”
    「しゅれーでぃんがー」
    の場合には別途検討
    同じ個体に同時に異なる処理はできない
    ねこの健康状態Yに対する栄養補助食Xの影響の例
    ぴかそ − ぴかそ

    View full-size slide

  79. 潜在反応モデル⼊⾨|
    Neyman-Rubinの潜在反応モデルの考え⽅
    潜在反応モデルの枠組みを⽤いると、”因果推論
    の根本問題”を「⽋測」の枠組みで捉えられる
    ぴかそ =
    ぴかそ + ( − ) ぴかそ
    Xが0/1のとき、観測値と潜在反応の関係は:
    ぴかそ = ぴかそ
    X=1のときはY1のみ観測可能 X=0のときはY0のみ観測可能
    ぴかそ = ぴかそ
    実際の処理と異なる潜在反応は”⽋測”となる
    ねこの健康状態Yに対する栄養補助食Xの影響の例

    View full-size slide

  80. 潜在反応モデル⼊⾨|
    Neyman-Rubinの潜在反応モデルの考え⽅
    「個⼈レベル」の因果効果は観測できないので
    「集団への平均効果」を考える
    X=0を「補助食なし」、X=1を「補助食あり」とする
    [ ねこ集団 ] − [(ねこ集団)]
    「ねこ集団A」へのX→Yの平均因果効果の定義
    実は依然、この両者をともには観測できない
    同じ集団全体に同時に異なる処理はできない
    ねこの健康状態Yに対する栄養補助食Xの影響の例

    View full-size slide

  81. 潜在反応モデルと関数的因果モデル|
    Neyman-Rubinの潜在反応モデルの考え⽅
    同じ集団から「処理X=あり」と「処理X=なし」
    のサブグループごとに分けて観測すればよい?
    X=0を「補助食なし」、X=1を「補助食あり」とする
    [ ねこ集団| = ] − [ ねこ集団| = ]
    「ねこ集団A」へのX→Yの平均因果効果?
    異なる処理Xを受けたサブ集団は質的に異なりうる
    のでバイアスが⽣じうる 例:体調が良くない個体がより補助⾷を処⽅さ
    れやすいと、「補助⾷あり」の⽅のねこ集団の
    ⽅がもともとの健康状態が悪くなりがち
    ねこの健康状態Yに対する栄養補助食Xの影響の例

    View full-size slide

  82. 潜在反応モデルと関数的因果モデル|
    Neyman-Rubinの潜在反応モデルの考え⽅
    何を知る必要があるのか、「観測できる項・
    できない項」を整理して考えてみる
    計算したいのは(たとえば)因果効果 (iv) – (ii)
    Average Treatment Effect of the Treated (ATT)
    X=0を受けた群 X=1を受けた群
    X=0の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    X=1の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    そもそも観測不能(反事実)
    そもそも観測不能(反事実)
    観測可能
    観測可能
    (i) (ii)
    (iii) (iv)
    けれども、(ii)は反事実なので観測&計算できない!
    反事実項の値を知るにはどうすればよい?

    View full-size slide

  83. 潜在反応モデルと関数的因果モデル|
    解決策1:無作為割付→反事実項を観察可能項で代替
    因果効果 (iv) – (ii) を (iv) – (i) として計算可能
    無作為割付→潜在反応と処理Xが独⽴→ &


    サンプル集団
    処理を無作為に割付
    X=0を割付された群 X=1を割付された群
    X=0の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    X=1の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    そもそも観測不能(反事実)
    そもそも観測不能(反事実)
    観測可能
    観測可能
    (i) (ii)
    (iii) (iv)
    =
    =
    無作為割付けにより
    各群における特性の分布は
    同等であると
    期待できる
    反事実である(ii)を観察可能な(i)で代替可能
    無視可能性条件

    View full-size slide

  84. 潜在反応モデルと関数的因果モデル|
    d
    X=0を受けた群 X=1を受けた群
    X=0の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    X=1の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    共変量
    の分布
    そもそも観測不能(反事実)
    そもそも観測不能(反事実)
    観測可能
    観測可能
    (i) (ii)
    (iii) (iv)
    共変量
    解決策2:傾向スコア法→反事実項を観察可能項で代替

    View full-size slide

  85. 潜在反応モデルと関数的因果モデル|
    d
    X=0を受けた群 X=1を受けた群
    X=0の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    X=1の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    共変量
    の分布
    そもそも観測不能(反事実)
    そもそも観測不能(反事実)
    観測可能
    観測可能
    (i) (ii)
    (iii) (iv)
    傾向スコアe
    共変量
    両群での共変量の分布のインバランスをpost-hocに補正するための
    バランシングスコアeを共変量から計算する
    解決策2:傾向スコア法→反事実項を観察可能項で代替

    View full-size slide

  86. 潜在反応モデルと関数的因果モデル|
    d
    X=0を受けた群 X=1を受けた群
    X=0の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    X=1の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    共変量
    の分布
    そもそも観測不能(反事実)
    そもそも観測不能(反事実)
    観測可能
    観測可能
    (i) (ii)
    (iii) (iv)
    eでマッチング・重みづけ
    傾向スコアe
    共変量
    両群での共変量の分布のインバランスをpost-hocに補正するための
    バランシングスコアeを共変量から計算する
    解決策2:傾向スコア法→反事実項を観察可能項で代替

    View full-size slide

  87. 潜在反応モデルと関数的因果モデル|
    d
    X=0を受けた群 X=1を受けた群
    X=0の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    X=1の潜
    在反応
    [ ねこ集団| = ] [ ねこ集団| = ]
    共変量
    の分布
    そもそも観測不能(反事実)
    そもそも観測不能(反事実)
    観測可能
    観測可能
    (i) (ii)
    (iii) (iv)
    =
    =
    潜在反応と処理Xが条件付き独⽴→ & |


    eでマッチング・重みづけ
    傾向スコアe
    共変量
    両群での共変量の分布のインバランスをpost-hocに補正するための
    バランシングスコアeを共変量から計算する
    因果効果 (iv) – (ii) を (iv) – (i) として計算可能
    条件付き無視
    可能性条件
    解決策2:傾向スコア法→反事実項を観察可能項で代替

    View full-size slide

  88. 補⾜|潜在反応と無視可能性とバックドア基準
    介⼊効果推定におけるバックドア基準とは

    バックドア基準は上式が成り⽴つ際に含まれる
    べき共変量Zのセット(上式の成⽴条件)を⽰す
    ・処置Xについてignorability/exchangabilityが成⽴して
    いるとき、交絡の影響なく介⼊効果推定が可能
    上式を満たすZを合成変数として構成したものが
    「傾向スコア」
    Conditional ignorability/exchangability:
    0 |

    ⊥ for all X=x
    コイントスの結果ZによりXを決定すると「RCT」
    ランダム⽣成機

    View full-size slide

  89. の条件を満たすことで、観察値に
    基づき「反事実」の項も計算可能
    (尚、バックドア基準を満たせば上記条件は満たされる)
    潜在反応モデルと関数的因果モデル|
    Neyman-Rubinの潜在反応モデルの特徴(まとめ)
    因果効果を「異なる処理に対する潜在反応の差
    分」として定義する
    因果効果の定義式には「反事実」の項が含まれる
    ! |


    潜在反応の中⾝(”why it works”)はブラック
    ボックスでも構わない
    *潜在反応がブラックボックスであるのは理論的
    な必然というわけではない(次の話につづく)
    尚、処理Xが連続量のときの
    表現が苦⼿という側⾯もある
    中⾝に関わらず適⽤できるので
    「推定プロトコル」への⾒通しがよい
    たとえばRCTとか傾向スコアなどで

    View full-size slide

  90. 本⽇の内容
    I. 構造から⾒た因果推論
    :DAGとバックドア基準の⼊⾨
    II. 差分から⾒た因果推論
    :潜在反応モデル⼊⾨
    III. 構造的因果モデル(SCM)による統合
    (1) 因果グラフのSCMによる表現
    (2) 潜在反応モデルのSCMによる表現
    (3) 潜在反応モデルとDAGとの繋がり
    IV. 差分と構造の統合 --- Issueの総合的理解へ

    View full-size slide

  91. 参考⽂献|⿊⽊(2017)
    ここからの話はこの本の
    第六章が元ネタです
    本⽇の説明は
    やや「超訳」的に
    なりますので
    正確な議論については
    ぜひ本書を
    ご参照ください

    View full-size slide

  92. 因果グラフと関数的因果モデル|
    構造的因果モデルSCM(a.k.a.関数因果モデル)とは
    因果構造を関数の親⼦関係の連なりの形で記述したもの
    関数因果モデルのフォーマルな定義
    ⾮巡回的有向グラフGとその頂点に対応する確率変数の集合V = {X1,…Xp}
    が与えられている.グラフGが確率変数間の関数関係を
    ⿊⽊(2017), p70より引⽤
    になる形に規定し、確率変数がこの関数関係にしたがって⾃律的でかつ
    定常的に⽣成されるとき、Gを因果ダイアグラムという.ここに、錯乱
    項ε1,…,εpは互いに独⽴であるとする.また、pa(Xi)は因果ダイアグラムG
    におけるXiの親全体からなる変数集合であり、GにおけるXiの直接的原因
    (direct cause)と解釈される.
    上式を広い意味で物理的なデータ⽣成過程のモデルとして捉えるとき、上式は
    関数因果モデルあるいは、構造⽅程式モデル、構造的因果モデルと呼ばれる.
    !
    = !
    !
    , !
    = 1, … ,
    これは等式というより代⼊式
    ベイジアンネットワークとは異なり「因果」概念を内包する
    Structural Causal Model

    View full-size slide

  93. 因果グラフと関数的因果モデル|
    構造的因果モデル(SCM)とは
    因果ダイアグラムはSCMの視覚的表現といえる
    (実は後者の⽅が表現できるものの幅は広い)
    因果構造を関数の親⼦関係で記述したもの
    GUIとCUIのようなイメージ(CUIが本体)
    Y
    X
    Z1
    Z2 Z3
    特定の関数型を特に
    念頭に置く話ではない
    = "
    (, 1)
    = #
    (2, 3)
    1 = $%
    (2)
    = ℎ"
    (2, 3)
    実は「Pearlの体系=グラフィカルモデル」と
    いうのは適切な理解ではない!
    こうも書けるし
    このように
    外⽣変数の関数
    としても書ける
    詳細は⿊⽊(2017)
    (錯乱項は省略)

    View full-size slide

  94. 本⽇の内容
    I. 構造から⾒た因果推論
    :DAGとバックドア基準の⼊⾨
    II. 差分から⾒た因果推論
    :潜在反応モデル⼊⾨
    III. 構造的因果モデル(SCM)による統合
    (1) 因果グラフのSCMによる表現
    (2) 潜在反応モデルのSCMによる表現
    (3) 潜在反応モデルとDAGとの繋がり
    IV. 差分と構造の統合 --- Issueの総合的理解へ

    View full-size slide

  95. 潜在反応モデルと関数的因果モデル|
    潜在反応モデルを関数的因果モデルで表現する
    #(ぴかそ) = ((), 1, 2, 3, . . , )
    「ぴかそ」の特性を表す全変数
    '(ぴかそ) = ( = 0, 1, 2, 3, . . , )
    ((ぴかそ) = ( = 1, 1, 2, 3, . . , )
    潜在反応の”中⾝”を関数と変数で表現している
    ぴかそ
    潜在反応は概念的にはその個体がもつ
    諸特性の決定論的関数で表現できる
    = 0,
    = 1,
    潜在反応の脱ブラックボックス化
    Stable Unit-Treatment Value Assumptionのより明⽰的な検討へ繋がる

    View full-size slide

  96. 潜在反応モデルと関数的因果モデル|
    例えば全特性が近似的に等しい個体がいれば…
    '(たつや) = ( = 0, 1, 2, 3, . . , )
    '(かずや) = ( = 0, 1, 2, 3, . . , )
    もし「たつや」「かずや」という双⼦がいて
    もし関数および変数が近似的に等しければ
    & たつや − ' たつや ≒ & たつや − ' かずや
    これは観測可能!
    「関数と特性」から識別可能性(バイアスの
    ない因果効果の推定が可能か)を議論しうる
    観測不可能な因果効果

    View full-size slide

  97. 潜在反応モデルと関数因果モデルと因果グラフ|
    集団Aへの平均因果効果を考える
    [&(集団)] = [((), 1, 2, . . . , )]
    平均因果効果=[= ねこ集団 − [C ねこ集団 ]
    = [= ねこ集団| = 1 ] − [C ねこ集団| = 0 ]
    [= 集団| = 1 ] = [ , 1, 2, . . , = 1 ]
    [C 集団| = 0 ] = [(, 1, 2, . . , | = 0)]
    もし異なる処理Xを受けたサンプル集団間で
    fおよびこれらZの分布が同等とみなせる場合
    異なる処理を受けた集団間で
    潜在反応の分布が異ならない
    観測値から因果効果を計算可能

    View full-size slide

  98. 本⽇の内容
    I. 構造から⾒た因果推論
    :DAGとバックドア基準の⼊⾨
    II. 差分から⾒た因果推論
    :潜在反応モデル⼊⾨
    III. 構造的因果モデル(SCM)による統合
    (1) 因果グラフのSCMによる表現
    (2) 潜在反応モデルのSCMによる表現
    (3) 潜在反応モデルとDAGとの繋がり
    IV. 差分と構造の統合 --- Issueの総合的理解へ

    View full-size slide

  99. 潜在反応モデルと関数因果モデルと因果グラフ|
    潜在反応モデルをDAGで表現してみると
    Y
    X
    Z1
    Z2
    Z3
    潜在反応に実際のXの値が与えられて観測値Yとなる
    "
    = D,
    = = + (1 − )C
    たとえばXが0/1のときはこう書ける
    ( = ( , 1, 3)

    View full-size slide

  100. 潜在反応モデルと関数因果モデルと因果グラフ|
    潜在反応モデルをDAGで表現してみると
    畢竟、潜在反応モデルと関数因果モデルと
    バックドア基準の話はシームレスに繋がっている
    Y
    X
    Z1
    Z2
    Z3
    バックドア基準に基づき、たとえばこの潜在反応モデ
    ルの例で調整する必要があるのはZ1だけ
    潜在反応に実際のXの値が与えられて観測値Yとなる
    "
    = D,
    = = + (1 − )C
    たとえばXが0/1のときはこう書ける
    ( = ( , 1, 3)
    ) |1


    条件付き無視可能性

    View full-size slide

  101. 本⽇の内容
    I. 構造から⾒た因果推論
    :DAGとバックドア基準の⼊⾨
    II. 差分から⾒た因果推論
    :潜在反応モデル⼊⾨
    III. 構造的因果モデル(SCM)による統合
    (1) 因果グラフのSCMによる表現
    (2) 潜在反応モデルのSCMによる表現
    (3) 潜在反応モデルとDAGとの繋がり
    IV. 差分と構造の統合 --- Issueの総合的理解へ

    View full-size slide

  102. 構造的因果モデルから帰納的/演繹的因果推論の全体を⾒る
    = ℎ"
    (2, 3)
    こうも書ける
    この形、⾮常に⼀般的である
    = (モデルパラメータベクトル)
    たとえばスパコンで回すような気候変動シミュレー
    ションモデル(What if/反事実的計算に⽤いられる)もこんな
    形で書きうる
    構造的因果モデルは⾮常に広いクラスのモデルを含む

    View full-size slide

  103. 潜在反応
    モデル
    メカニズムが
    ブラックボックス
    であるたぐいの
    物理シミュレー
    ションモデル
    因果効果推定アプローチの連続的な理論観(私⾒)
    中間変数を介
    す2段階回帰
    under
    フロントドア
    基準
    構造推定@
    経済学
    X以外の共変量を
    バランシングして
    いくたぐいの
    = (処理, 外⽣変数)
    重回帰
    under
    バックドア
    基準
    RCT, 準実験
    例えばスパコンで回す
    ような気候変動モデル
    関数fと変数zについての
    モデル式の正当性に依存しない
    ただし、関数fと変数zの理論が
    なければ移設可能性の把握が困難
    関数fと変数zについての
    モデル式の正当性に依存する
    関数fと変数zの同等性の検討
    により移設可能性を議論可能
    祖先変数を介
    す操作変数・
    ⼆段階SLS
    構造的因果モデルから帰納的/演繹的因果推論の全体を⾒る
    Full-of-Model
    Model-free
    X→Yの祖先-⼦孫
    系列の効果伝搬を
    演繹計算・集計し
    ていくたぐいの

    View full-size slide

  104. (2) 「Issueの総合的理解」における因果推論
    ༗ػਫۜ
    ͷੜ੒
    ਫ࢈෺
    ࢢຽ
    ࢢ৔
    例:有機⽔銀汚染に対する環境リスク研究者の"頭の中”
    ޻৔Ͱͷ
    ੜ࢈աఔ
    ړࢣ
    ഉਫ
    ւͰͷ
    ੜ෺ೱॖ
    ւͰͷ
    Ԛછ஝ੵ
    “Issue/problem-driven”の解析者と、”Method-
    driven”の解析者の”頭の中”は異なる
    Issue-drivenの解析者の
    多くは常に頭の中に
    何らかの
    "因果モデル"をもつ

    View full-size slide

  105. (2) 「Issueの総合的理解」における因果推論
    105
    どこに介⼊しうるのか/もし介⼊したらどうなるのかについてのアイデ
    アが常に頭の中をぐるぐるしている
    ༗ػਫۜ
    ͷੜ੒
    ਫ࢈෺
    ࢢຽ
    ࢢ৔
    ޻৔Ͱͷ
    ੜ࢈աఔ
    ړࢣ
    ഉਫ
    ւͰͷ
    ੜ෺ೱॖ
    ւͰͷ
    Ԛછ஝ੵ
    ⼯場の⽣産過程を
    変えれば有機⽔銀
    の⽣成を抑えられ
    るのでは?
    排⽔処理を変えれ
    ば有機⽔銀を除去
    できるのでは?
    禁漁により⼈への
    曝露を防げるのは?
    浚渫により汚染を
    低減できるので
    は?
    市場への流通を⽌めれば
    市⺠への曝露は防げるのでは?
    妊婦や⼦供などへの注意喚起により
    ハイリスクグループへの曝露を減ら
    せるのでは?
    市場への流通を⽌める
    と⾃家消費により曝露
    が増えるかも?
    例:有機⽔銀汚染に対する環境リスク研究者の"頭の中”

    View full-size slide

  106. 「差異」と「構造」の繋がりが⾒えないと・・
    106
    • 頭の中の"因果モデル"と「介⼊効果推定」の関係性は?
    頭の中の"因果モデル"
    ༗ػਫۜ
    ͷੜ੒
    ਫ࢈෺
    ࢢຽ
    ࢢ৔
    ޻৔Ͱͷ
    ੜ࢈աఔ
    ړࢣ
    ഉਫ
    ւͰͷ
    ੜ෺ೱॖ
    ւͰͷ
    Ԛછ஝ੵ
    (政策的対応を念頭においた)
    介⼊効果推定
    市場=
    流通禁⽌
    市場=
    流通あり
    市⺠の
    健康
    市⺠の
    健康
    ここの差分
    =介⼊効果
    どちらかに思考のピントが合っているとき、もう⼀⽅はぼやけてしまう

    View full-size slide

  107. 「差異」と「構造」の繋がりが⾒えないと・・
    107
    • 頭の中の"因果モデル"と「介⼊効果推定」の関係性は?
    頭の中の"因果モデル"
    ༗ػਫۜ
    ͷੜ੒
    ਫ࢈෺
    ࢢຽ
    ࢢ৔
    ޻৔Ͱͷ
    ੜ࢈աఔ
    ړࢣ
    ഉਫ
    ւͰͷ
    ੜ෺ೱॖ
    ւͰͷ
    Ԛછ஝ੵ
    (政策的対応を念頭においた)
    介⼊効果推定
    市場=
    流通禁⽌
    市場=
    流通あり
    市⺠の
    健康
    市⺠の
    健康
    ここの差分
    =介⼊効果
    どちらかに思考のピントが合っているとき、もう⼀⽅はぼやけてしまう

    View full-size slide

  108. 108
    両者にピントを合わせて思考できるようになってくる
    頭の中の"因果モデル"
    ༗ػਫۜ
    ͷੜ੒
    ਫ࢈෺
    ࢢຽ
    ࢢ৔
    ޻৔Ͱͷ
    ੜ࢈աఔ
    ړࢣ
    ഉਫ
    ւͰͷ
    ੜ෺ೱॖ
    ւͰͷ
    Ԛછ஝ੵ
    (政策的規制措置等を念頭においた)
    介⼊効果推定
    do(市場=
    流通禁⽌)
    do(市場=
    流通あり)
    市⺠の
    健康
    市⺠の
    健康
    ここの差分
    =介⼊効果
    両者の関係が⾒えるぞ・・・!
    「差異」と「構造」の繋がりが⾒えてくると・・・

    View full-size slide

  109. バックドア基準
    構造的因果モデル
    そのときふと
    ⾃分の⾜元を
    ⾒てみてみると・・
    両者にピントを合わせて思考できるように
    「差異」と「構造」の繋がりが⾒えてくると・・・
    DAG

    View full-size slide

  110. 110
    両者にピントを合わせて思考できるようになってくる
    頭の中の"因果モデル"
    ༗ػਫۜ
    ͷੜ੒
    ਫ࢈෺
    ࢢຽ
    ࢢ৔
    ޻৔Ͱͷ
    ੜ࢈աఔ
    ړࢣ
    ഉਫ
    ւͰͷ
    ੜ෺ೱॖ
    ւͰͷ
    Ԛછ஝ੵ
    (政策的規制措置等を念頭においた)
    介⼊効果推定
    do(市場=
    流通禁⽌)
    do(市場=
    流通あり)
    市⺠の
    健康
    市⺠の
    健康
    ここの差分
    =介⼊効果
    両者の関係が⾒えるぞ・・・!
    差異と構造の繋がりが⾒えてくると・・・

    View full-size slide

  111. 統計的因果推論と諸研究の関連性のイメージ
    因果
    モデル
    関数fと変数Zのあり
    よう⾃体を分析対象
    とした質的/量的研究
    介⼊効果
    推定
    統計的
    因果推論
    分析概念の/関数fと変数Zの
    モデルの⾼解像度化
    バイアスの減少
    Target/SUTVAの明確化
    深化
    効果の定量的な実証
    量的な重要度の明確化
    介⼊効果がいかに/どの程度⽣じるかについての
    “Sufficiently deep explanation”を社会に提供できる
    Morgan and Winship (2014)
    「差がありました」の先の
    「どうすればいいの?」に答えたい!

    View full-size slide

  112. 統計的因果推論で因果グラフを⽤いることの効⽤
    ・ 調整すべき変数についての論理が得られる
    ・ 量的(統計的)研究と質的研究の橋渡しとなりうる
    ・ 調整すべき変数を絞り込むことができる
    ・ 感度分析・媒介効果分析への橋渡しとなりうる
    ・ 調整すべき変数の抜け漏れを防げる
    ・ 因果の図解⾃体が関係者とのやりとりに役⽴つ
    ・ ⼀般化可能性についての議論も深まりやすくなる(⼀般化可能性
    は⽣成メカニズムの安定性や類似性にも⼤きく依存するため)
    ・ 識別可能性の前提条件の成⽴を検証するための視覚化
    “Assumptions visualization tool”
    ・ 結果・処理・共変量の変数の概念的妥当性の吟味に役⽴つ
    “Issueの総合的理解”への⾒通しが開きやすい

    View full-size slide

  113. バックドア基準は、背景にある因果構造を基に「バ
    イアスのない因果効果推定」のためにはどの変数を
    考慮するべきかの理論的条件を与える
    本⽇の話の全体まとめ

    潜在反応モデルは「潜在反応の差分」として因果効
    果を定式化し、因果効果推定の解析プロトコルへの
    明瞭な⾒通しを与える

    構造的因果モデルは⾮常に広いクラスの因果効果推
    定アプローチを包含しうるものであり、issueの総合
    的理解へ向けた統計的/理論的/理念的な
    perspectiveの基盤となりうる

    View full-size slide

  114. Letʼs 因果推論!
    Enjoy!

    View full-size slide