Upgrade to Pro — share decks privately, control downloads, hide ads and more …

統計的因果推論、構造から見るか? 差分から見るか?:非巡回有向グラフ(DAG)、潜在反応モデル、そして構造的 (関数)因果モデルによる両者の統合的理解

takehikoihayashi
December 21, 2020
13k

統計的因果推論、構造から見るか? 差分から見るか?:非巡回有向グラフ(DAG)、潜在反応モデル、そして構造的 (関数)因果モデルによる両者の統合的理解

応用数理学会ものづくり研究会(2020/12/18)で発表機会をいただいた、「因果推論の諸理論の統合的理解」をテーマとした発表です。Rubinの潜在反応モデルとPearlの構造的因果モデルの統合的理解がテーマです。(大きなテーマを60分枠に詰め込んだので、ややギチギチした作りになっています。大部分は過去の発表のマッシュアップですが、統合的理解のところの説明はちょっとアップデートされています)

takehikoihayashi

December 21, 2020
Tweet

More Decks by takehikoihayashi

Transcript

  1. ⾃⼰紹介|どんな研究をしているのか ⽣態リスク評価、確率的リスク分析、因果推論 Yij θAlgae σj Means SD θFish Sensitivity differences

    among taxonomic groups Normal distributions Log(NOEC) Parameters were estimated by MCMC simulations θInvertebrate 階層ベイズモデルとモンテカルロシミュレーションを ⽤いた化学物質の⽣態リスクの定量化とリスク⽐較 Hayashi & Kashiwagi (2009) Hayashi & Kashiwagi (2010) Monte Carlo Analysis EPAF = F µ ECD - µ SSD s ECD 2 + s SSD 2 æ è ç ç ö ø ÷ ÷ µ ECD µ SSD s ECD s SSD Calculation of predictive distribution of EPAF Posterior distributions of ECD parameters Posterior distributions of SSD parameters Results: Quantitative Risk Comparison Median and 90% range of EPAF log10(EPAF) Large Risk→ ←Small Risk Chemicals Ammonia Copper Nickel Zinc Hayashi and Kashiwagi (2011)
  2. ⾃⼰紹介|どんな研究をしているのか 『はじめてのバックドア基準』 (Pearlの関数的因果モデルの解説) ⽣態リスク評価、確率的リスク分析、因果推論 ネオニコチノイド系農薬の ⾚トンボへの影響の因果推論 !",$ = &",$ −

    &"(),$ &"(),$ = +) ,-./)," − ,-./),"() + ⋯ + +2 ,-./2," − ,-./2,"() ++" 3-45" + 6) 7)," + ⋯ + 68 78,"                 背景知識からの因果モデルの構築 バックドア基準に基づく 統計モデルの構築 因果効果の推定 Takeshita et al. (2020)など
  3. ⾃⼰紹介|どんな研究をしているのか 『はじめてのバックドア基準』 (Pearlの関数的因果モデルの解説) ⽣態リスク評価、確率的リスク分析、因果推論 ネオニコチノイド系農薬の ⾚トンボへの影響の因果推論 !",$ = &",$ −

    &"(),$ &"(),$ = +) ,-./)," − ,-./),"() + ⋯ + +2 ,-./2," − ,-./2,"() ++" 3-45" + 6) 7)," + ⋯ + 68 78,"                 背景知識からの因果モデルの構築 バックドア基準に基づく 統計モデルの構築 因果効果の推定 Takeshita et al. (2020)など Problem/issue-driven (not methodology-driven) の研究者による 因果推論のユーザー視点から⾒た 因果推論の理論的側⾯についての話 数理的には物⾜りないかもしれませんがご容赦ください 本⽇の話について:
  4. I. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ II. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ III. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現

    (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり IV. 差分と構造の統合 --- Issueの総合的理解へ 本⽇の⽬次
  5. バックドア基準は、背景にある因果構造を基に「バ イアスのない因果効果推定」のためにはどの変数を 考慮するべきかの理論的条件を与える (Preview) 本⽇の話の全体まとめ ▪ 潜在反応モデルは「潜在反応の差分」として因果効 果を定式化し、因果効果推定の解析プロトコルへの 明瞭な⾒通しを与える ▪

    構造的因果モデルは⾮常に広いクラスの因果効果推 定アプローチを包含しうるものであり、issueの総合 的理解へ向けた統計的/理論的/理念的な perspectiveの基盤となりうる ▪ 1時間枠で⾏けるところまで⾏ければ “統計レシピ”ではなくレシピの裏側にある”考え⽅”に関する話
  6. 導⼊|相関と因果は違う 散布図上の相関関係からの素朴な予測や期待と 因果効果(介⼊効果)がズレることがある ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬

    ͷ छ ਺ : p < 0.001 「Xが⼩さいとき、Yは⼤きい」 (=相関関係がある)とほぼ確実に⾔える 「Xを⼩さくすると、Yは⼤きくなる」 (=因果関係がある)と⾔えるか?
  7. 導⼊|相関と因果は違う もしYの状態がXにより部分的に⽣じているなら ば、Xを減少させればYは部分的に回復する ▪ ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬

    ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ 「Xを⼩さくすると、Yは⼤きくなる」かは Yの状態が何によって⽣じているかに依存する
  8. 導⼊|相関と因果で必要とされる⽅法論が違う p(Y|X=⼩さい) Xが⼩さいときのYの計算 p(Y|X=do(⼩さい)) Xを⼩さくしたときのYの計算 因果の問題 相関の問題 p(Y|X=see(⼩さい)) あるいは、いうなれば なぜズレるの?

    交絡のせい! 内⽣性のせい! ⼀歩込み⼊った議論をする際に判断に迷うことがある 本章の ⽬標 「バックドアパスが開いているせい」 「バックドア基準が満たされていないせい」 という説明の仕⽅・概念を理解する association
  9. 超ざっくり説明|”バックドアパス”とは? 「バックドアパス」=『処理Xと結果Yの上 流側にある両者に影響を与える流れ』 ▪ X Y Z1 Z2 (X→Yの) バックドアパス

    ではない! 上流側にある「Z1」に インクをぶちまけても Xにしか到達しない (=両者には影響を与えない) *Xそのものを通してYへ繋がる 流れはノーカウント
  10. 超ざっくり説明|バックドアパスの何が問題? 上流側の変動に伴い”シンクロ”が⽣じる ▪ X Y Z X Y Zの変動によりX-Y間に "シンクロ"が⽣じる

    Zが⼤ Zが⼩ (X→Yの) バックドアパス このZの変動によるシンクロが”疑似相関”を⽣み、 X→Yの介⼊効果の推定にバイアスをもたらす ⾮因果的 連関
  11. 超ざっくり説明|バックドアパスが”閉じる”とは? バックドアパスが”閉じる”=バックドアパス 上の変数を”固定”する ▪ X Y Z Zを“固定”する バックドアパスが”閉じ” 交絡の影響が消える

    シンクロを⽣む流れが “ブロック”される Zで層別化して解析 重回帰分析の共変量としてZをモデルに追加 “固定”= 条件付けconditioning の⼿法の例 ・ ・
  12. 超ざっくり説明|バックドアパスが”閉じる”とは? 参考:Zでの層別化(X:汚染濃度, Y:種数, Z:流域) ▪ 「上流」「下流」の層別に X→Yの効果を計算して集計する Z:流域 X:汚染 濃度

    Y:種数 流域Zを層別化により”固定”し解析することで交絡 の影響が消え、介⼊効果がバイアスなく推定できる ؀ڥԚછ෺࣭ͷՏ઒தೱ౓ 9 ఈ ੜ ࠛ ஬ ͷ छ ਺ : ԼྲྀҬ ্ྲྀҬ
  13. 超ざっくり説明|パスが”開きっぱなし”とは? バックドアパスが開きっぱなし=変数が固定 されずパスの流れが”ブロック”されていない ▪ X Y Z X Y Zの変動によりX-Y間に

    "シンクロ"が⽣じる Zが⼤ Zが⼩ (X→Yの) バックドアパス ⾮因果的 連関 介⼊効果の推定のバイアスが調整されぬまま残る
  14. 超ざっくり追記|固定により”開く”こともある 参考:合流点となる「合否」を”固定” ▪ 実 技 試 験 Z:合否 Y:実技 試験

    美⼤の⼊学試験における仮想例 合格者 Z=1 不合格者 Z=0 X:学⼒ 試験 100 100 学⼒試験 合 格 ラ イ ン
  15. 超ざっくり追記|固定により”開く”こともある 参考:合流点となる「合否」を”固定” ▪ 実 技 試 験 Z:合否 Y:実技 試験

    美⼤の⼊学試験における仮想例 合否Zで層別化すると、XとYの間に⾮因果的な連関 が⽣じ、X→Yの介⼊効果の推定にバイアスが⽣じる 合格者 Z=1 不合格者 Z=0 X:学⼒ 試験 100 100 学⼒試験 合 格 ラ イ ン
  16. 具体例でおさらい|3変量(X, Y, Z)の場合 3変量で⾒る”ほぼ バックドア基準” ▪ X Y Z )

    X Y Z ) X Z Y ( ) Zを加えよ Zを加えるな *3変量の場合では、巷の”rule-of-thumb”的な変数選択 ルール以上のご利益はあまり感じられないかも
  17. 具体例でおさらい|4変量の場合 4変量以上だと「道」を考える必要がある ▪ X Y Z1 Z2 もし処理Xと結果Yの「両者の共通 原因」を”交絡変数”と呼ぶ場合 Z2は”交絡変数”かつ分岐点

    Z1は”交絡変数”と呼ばれない 必ずモデルに追加すべき? モデルに追加しなくてよい? common cause *Z2は観測不可能、Z1は観測済み のときどうする?
  18. 4変量以上の場合|本質は”道”にあり 4変量以上の”道”:合流点の例 ▪ Z1 X Z2 Y Z3 Z1 X

    Y Z3 X Z2 Y Z3 X→Y   Z1 Z2 X Y Z3 Z1 Z2 バックドアパスが "開いている" バックドアパスは"閉まっている" バックドアパスの”道”がブロック されていることが肝要
  19. 4変量以上の場合|本質は”道”にあり 4変量以上の”道”:中間点の場合 ▪ X Y Z2 Z1 Z1, Z2は中間点 絶対にモデルに追加

    したらダメ? 中間点を⼊れるとXからの 因果効果⾃体が ブロックされてしまうのでダメ! (これは3変量の場合と同様)
  20. 4変量以上の場合|まとめ X Y Z2 Z1 X Y X Y Z1

    Z2 Z2 Z1 X Y Z1 Z2 X Y X Y Z2 Z1 Z1 Z2 バックドアパス をブロックしろ X→Yの道を ブロックするな もうほとんどバックドア基準 細かい論点をのぞけば 畢竟, 以下2つのメッセージに集約される ▪
  21. ステップ6 | "まとめ"としてのバックドア基準 教科書内の「バックドア基準」を解読してみよう ⿊⽊学(2017)『構造的因果モデルの基礎』 p99より引⽤ ▪ 1. XからZの任意の要素に有向道がない 2.

    GよりXから出る⽮線(X→)を除いたグラフにおいて、 ZがXとYを有向分離する 定義 3-5 バックドア基準(back door criterion) “逆”のケース(XがYの下流)ではない ⾮巡回的有向グラフGにおいてXはYの⾮⼦孫である。このとき、次 の2条件を満たす頂点集合Zは、(X, Y)についてバックドア基準を 満たすという 例:中間変数や下流の合流点 Xの下流の共変量をモデルに加えてはいけない バックドアパスがブロックされている
  22. 4変量以上の場合|まとめ(再掲) X Y Z2 Z1 X Y X Y Z1

    Z2 Z2 Z1 X Y Z1 Z2 X Y X Y Z2 Z1 Z1 Z2 バックドアパス をブロックしろ X→Yの道を ブロックするな もうほとんどバックドア基準 ものすごい細かい論点をのぞけば 畢竟, 以下2つのメッセージに集約される ▪ 条件(1)に対応 条件(2)に対応
  23. 例題その2|どの変数を加えれば良い? X Y Z4 Z3 Z2 Z5 Z6 Z1 バックドア基準

    を満たす最⼩の 変数セットは 「Z1」 *ここでZ5, Z6を⼊れると 新たなバックドアパスが 開いてしまう *Z4はそもそも 中間点なので⼊れてはダメ Z1をブロックすると2つの バックドアパスが全て遮断される
  24. ⼀部が不明な場合|どの変数を加えれば良い? X Z1 Z2 この部分の 因果構造は不明 Y 「Z1, Z2」を加えればバックドア基準を満たす Z1,

    Z2をブロックすれば バックドアパスは 遮断される ポイントとなる部分の適切な粒度の背景知識があればよい
  25. 補⾜|実験における無作為化との関係 X Y Z1 Z3 Z2 Z5 Z6 Z4 So

    many バックドアパス 実験はランダム⽣成機によりバックドアパスを閉じる ▪
  26. 補⾜|実験における無作為化との関係 X Y Z1 Z3 Z2 Z5 Z6 Z4 コイントス

    実験は”ランダム⽣成機”によりバックドアパスを閉じる ▪
  27. 補⾜ |傾向スコアとの関係 X Y Z1 Z3 Z2 Z5 Z6 Z4

    e 傾向スコアで まとめてブロック 傾向スコアはバックドアパスをブロックする"合成変数" ▪ うまく適⽤できれば超強⼒な⼿法!
  28. I. DAGとバックドア基準のまとめ “バックドア基準が満たされている” ▪ + (2) 処理Xの下流の変数が追加されていない (1) 開きっぱなしのバックドアパスがない ≒

    変数ベースではなく”道”の開閉がキモ ▪ ・たとえ森羅万象が因果関係で繋がっていても、因 果効果を識別可能とするために考えるべき局所的 な因果構造と変数の範囲を理論的に限定できる ・傾向スコアもバックドアパスを閉じるための強⼒ な⼿法(バックドア基準は理論的条件) 介⼊効果がバイアスなく推定できる *データが適切に測定されており、かつ適切なモデルが適⽤されているという⼤前提での話です
  29. 林岳彦・⿊⽊学(2016) 「相関関係」と「因果関係」は違います。これはよく知られています。ある要 因 X ともうひとつの要因 Y のあいだに高い相関が見られたからといって,それ らのあいだに因果的な関係があるとは限りません。一方で,そのような高い相関 を「因果関係」として解釈できる場合もたしかにあります。この辺りが難しいと ころです。もしあなたの同僚やクライアントが,あなたが作成した散布図を見て

    「相関関係」と「因果関係」を明らかに混同した発言をしはじめたとしましょう。 このとき, 「この場合はこれこれこうだからこの相関関係は因果関係として解釈 できるんですよ/できないんですよ」と相手に向かって理路整然と説明するのは, それほど簡単なことではありません。こと因果関係の話になると,自分の頭の中 でその内容を整理するのも,その内容を相手に伝わるように説明するのも,なか なか難しいものです。 私たちの経験上,そんなときにとても役に立つのは,データの背後に想定して いる「因果構造(データ生成のメカニズム)」についての(分かる範囲での)簡単な ポンチ絵を丸と矢印で描いてみせることです[本稿ではそんなポンチ絵の例がたくさん 出てきます]。そして,そのようなポンチ絵を描いたあとに,その描かれた因果構 造が「あ ・ る ・ 特 ・ 定 ・ の ・ 条 ・ 件 ・ 群 ・ 」を満たしているかどうかを相手と共同で検討していき ます。多くの場合,その検討を通して「この相関関係は因果関係を示していると 解釈してよいのか?」や「相関関係を因果関係として解釈するためには本来はど のようなデータが必要なのか?」といった本質的な問いについて,より明確かつ 端的な議論ができるようになります。 相関と因果と丸と矢印のはなし はじめてのバックドア基準 林岳彦(国立環境研究所)・黒木学(統計数理研究所) [特集]因果推論 現実の課題に答える統計学 参考⽂献 | バックドア基準の解説原稿 (本⽇の元ネタ) 2016年6⽉発売「岩波データサイエンスvol. 3」因果推論特集号
  30. I. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ II. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ III. 構造的因果モデル(SCM)による統合 (1) 因果グラフのSCMによる表現

    (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり IV. 差分と構造の統合 --- Issueの総合的理解へ 本⽇の⽬次
  31. 潜在反応モデル⼊⾨| Neyman-Rubinの潜在反応モデルの考え⽅ 処理 = に対して、各個体は⼀意な(決定論 的に定まる)潜在反応() をもつ (ぴかそ) ねこの健康状態Yに対する栄養補助食Xの影響の例 ぴかそ

    だり X=0を「補助食なし」、X=1を「補助食あり」とする もし「ぴかそ」が 「補助⾷あり」のときの 「ぴかそ」の健康状態 もし「だり」が 「補助⾷なし」のときの 「だり」の健康状態 (だり)
  32. 潜在反応モデル⼊⾨| Neyman-Rubinの潜在反応モデルの考え⽅ 潜在反応モデルの枠組みを⽤いると、”因果推論 の根本問題”を「⽋測」の枠組みで捉えられる ぴかそ = ぴかそ + ( −

    ) ぴかそ Xが0/1のとき、観測値と潜在反応の関係は: ぴかそ = ぴかそ X=1のときはY1のみ観測可能 X=0のときはY0のみ観測可能 ぴかそ = ぴかそ 実際の処理と異なる潜在反応は”⽋測”となる ねこの健康状態Yに対する栄養補助食Xの影響の例
  33. 潜在反応モデル⼊⾨| Neyman-Rubinの潜在反応モデルの考え⽅ 「個⼈レベル」の因果効果は観測できないので 「集団への平均効果」を考える X=0を「補助食なし」、X=1を「補助食あり」とする [ ねこ集団 ] − [(ねこ集団)]

    「ねこ集団A」へのX→Yの平均因果効果の定義 実は依然、この両者をともには観測できない 同じ集団全体に同時に異なる処理はできない ねこの健康状態Yに対する栄養補助食Xの影響の例
  34. 潜在反応モデルと関数的因果モデル| Neyman-Rubinの潜在反応モデルの考え⽅ 同じ集団から「処理X=あり」と「処理X=なし」 のサブグループごとに分けて観測すればよい? X=0を「補助食なし」、X=1を「補助食あり」とする [ ねこ集団| = ] −

    [ ねこ集団| = ] 「ねこ集団A」へのX→Yの平均因果効果? 異なる処理Xを受けたサブ集団は質的に異なりうる のでバイアスが⽣じうる 例:体調が良くない個体がより補助⾷を処⽅さ れやすいと、「補助⾷あり」の⽅のねこ集団の ⽅がもともとの健康状態が悪くなりがち ねこの健康状態Yに対する栄養補助食Xの影響の例
  35. 潜在反応モデルと関数的因果モデル| Neyman-Rubinの潜在反応モデルの考え⽅ 何を知る必要があるのか、「観測できる項・ できない項」を整理して考えてみる 計算したいのは(たとえば)因果効果 (iv) – (ii) Average Treatment

    Effect of the Treated (ATT) X=0を受けた群 X=1を受けた群 X=0の潜 在反応 [ ねこ集団| = ] [ ねこ集団| = ] X=1の潜 在反応 [ ねこ集団| = ] [ ねこ集団| = ] そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) けれども、(ii)は反事実なので観測&計算できない! 反事実項の値を知るにはどうすればよい?
  36. 潜在反応モデルと関数的因果モデル| 解決策1:無作為割付→反事実項を観察可能項で代替 因果効果 (iv) – (ii) を (iv) – (i)

    として計算可能 無作為割付→潜在反応と処理Xが独⽴→ & ⊥ ⊥ サンプル集団 処理を無作為に割付 X=0を割付された群 X=1を割付された群 X=0の潜 在反応 [ ねこ集団| = ] [ ねこ集団| = ] X=1の潜 在反応 [ ねこ集団| = ] [ ねこ集団| = ] そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) = = 無作為割付けにより 各群における特性の分布は 同等であると 期待できる 反事実である(ii)を観察可能な(i)で代替可能 無視可能性条件
  37. 潜在反応モデルと関数的因果モデル| d X=0を受けた群 X=1を受けた群 X=0の潜 在反応 [ ねこ集団| = ]

    [ ねこ集団| = ] X=1の潜 在反応 [ ねこ集団| = ] [ ねこ集団| = ] 共変量 の分布 そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) 共変量 解決策2:傾向スコア法→反事実項を観察可能項で代替
  38. 潜在反応モデルと関数的因果モデル| d X=0を受けた群 X=1を受けた群 X=0の潜 在反応 [ ねこ集団| = ]

    [ ねこ集団| = ] X=1の潜 在反応 [ ねこ集団| = ] [ ねこ集団| = ] 共変量 の分布 そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) 傾向スコアe 共変量 両群での共変量の分布のインバランスをpost-hocに補正するための バランシングスコアeを共変量から計算する 解決策2:傾向スコア法→反事実項を観察可能項で代替
  39. 潜在反応モデルと関数的因果モデル| d X=0を受けた群 X=1を受けた群 X=0の潜 在反応 [ ねこ集団| = ]

    [ ねこ集団| = ] X=1の潜 在反応 [ ねこ集団| = ] [ ねこ集団| = ] 共変量 の分布 そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) eでマッチング・重みづけ 傾向スコアe 共変量 両群での共変量の分布のインバランスをpost-hocに補正するための バランシングスコアeを共変量から計算する 解決策2:傾向スコア法→反事実項を観察可能項で代替
  40. 潜在反応モデルと関数的因果モデル| d X=0を受けた群 X=1を受けた群 X=0の潜 在反応 [ ねこ集団| = ]

    [ ねこ集団| = ] X=1の潜 在反応 [ ねこ集団| = ] [ ねこ集団| = ] 共変量 の分布 そもそも観測不能(反事実) そもそも観測不能(反事実) 観測可能 観測可能 (i) (ii) (iii) (iv) = = 潜在反応と処理Xが条件付き独⽴→ & | ⊥ ⊥ eでマッチング・重みづけ 傾向スコアe 共変量 両群での共変量の分布のインバランスをpost-hocに補正するための バランシングスコアeを共変量から計算する 因果効果 (iv) – (ii) を (iv) – (i) として計算可能 条件付き無視 可能性条件 解決策2:傾向スコア法→反事実項を観察可能項で代替
  41. の条件を満たすことで、観察値に 基づき「反事実」の項も計算可能 (尚、バックドア基準を満たせば上記条件は満たされる) 潜在反応モデルと関数的因果モデル| Neyman-Rubinの潜在反応モデルの特徴(まとめ) 因果効果を「異なる処理に対する潜在反応の差 分」として定義する 因果効果の定義式には「反事実」の項が含まれる ! |

    ⊥ ⊥ 潜在反応の中⾝(”why it works”)はブラック ボックスでも構わない *潜在反応がブラックボックスであるのは理論的 な必然というわけではない(次の話につづく) 尚、処理Xが連続量のときの 表現が苦⼿という側⾯もある 中⾝に関わらず適⽤できるので 「推定プロトコル」への⾒通しがよい たとえばRCTとか傾向スコアなどで
  42. 本⽇の内容 I. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ II. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ III. 構造的因果モデル(SCM)による統合 (1)

    因果グラフのSCMによる表現 (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり IV. 差分と構造の統合 --- Issueの総合的理解へ
  43. 因果グラフと関数的因果モデル| 構造的因果モデルSCM(a.k.a.関数因果モデル)とは 因果構造を関数の親⼦関係の連なりの形で記述したもの 関数因果モデルのフォーマルな定義 ⾮巡回的有向グラフGとその頂点に対応する確率変数の集合V = {X1,…Xp} が与えられている.グラフGが確率変数間の関数関係を ⿊⽊(2017), p70より引⽤

    になる形に規定し、確率変数がこの関数関係にしたがって⾃律的でかつ 定常的に⽣成されるとき、Gを因果ダイアグラムという.ここに、錯乱 項ε1,…,εpは互いに独⽴であるとする.また、pa(Xi)は因果ダイアグラムG におけるXiの親全体からなる変数集合であり、GにおけるXiの直接的原因 (direct cause)と解釈される. 上式を広い意味で物理的なデータ⽣成過程のモデルとして捉えるとき、上式は 関数因果モデルあるいは、構造⽅程式モデル、構造的因果モデルと呼ばれる. ! = ! ! , ! = 1, … , これは等式というより代⼊式 ベイジアンネットワークとは異なり「因果」概念を内包する Structural Causal Model
  44. 因果グラフと関数的因果モデル| 構造的因果モデル(SCM)とは 因果ダイアグラムはSCMの視覚的表現といえる (実は後者の⽅が表現できるものの幅は広い) 因果構造を関数の親⼦関係で記述したもの GUIとCUIのようなイメージ(CUIが本体) Y X Z1 Z2

    Z3 特定の関数型を特に 念頭に置く話ではない = " (, 1) = # (2, 3) 1 = $% (2) = ℎ" (2, 3) 実は「Pearlの体系=グラフィカルモデル」と いうのは適切な理解ではない! こうも書けるし このように 外⽣変数の関数 としても書ける 詳細は⿊⽊(2017) (錯乱項は省略)
  45. 本⽇の内容 I. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ II. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ III. 構造的因果モデル(SCM)による統合 (1)

    因果グラフのSCMによる表現 (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり IV. 差分と構造の統合 --- Issueの総合的理解へ
  46. 潜在反応モデルと関数的因果モデル| 潜在反応モデルを関数的因果モデルで表現する #(ぴかそ) = ((), 1, 2, 3, . .

    , ) 「ぴかそ」の特性を表す全変数 '(ぴかそ) = ( = 0, 1, 2, 3, . . , ) ((ぴかそ) = ( = 1, 1, 2, 3, . . , ) 潜在反応の”中⾝”を関数と変数で表現している ぴかそ 潜在反応は概念的にはその個体がもつ 諸特性の決定論的関数で表現できる = 0, = 1, 潜在反応の脱ブラックボックス化 Stable Unit-Treatment Value Assumptionのより明⽰的な検討へ繋がる
  47. 潜在反応モデルと関数的因果モデル| 例えば全特性が近似的に等しい個体がいれば… '(たつや) = ( = 0, 1, 2, 3,

    . . , ) '(かずや) = ( = 0, 1, 2, 3, . . , ) もし「たつや」「かずや」という双⼦がいて もし関数および変数が近似的に等しければ & たつや − ' たつや ≒ & たつや − ' かずや これは観測可能! 「関数と特性」から識別可能性(バイアスの ない因果効果の推定が可能か)を議論しうる 観測不可能な因果効果
  48. 潜在反応モデルと関数因果モデルと因果グラフ| 集団Aへの平均因果効果を考える [&(集団)] = [((), 1, 2, . . .

    , )] 平均因果効果=[= ねこ集団 − [C ねこ集団 ] = [= ねこ集団| = 1 ] − [C ねこ集団| = 0 ] [= 集団| = 1 ] = [ , 1, 2, . . , = 1 ] [C 集団| = 0 ] = [(, 1, 2, . . , | = 0)] もし異なる処理Xを受けたサンプル集団間で fおよびこれらZの分布が同等とみなせる場合 異なる処理を受けた集団間で 潜在反応の分布が異ならない 観測値から因果効果を計算可能
  49. 本⽇の内容 I. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ II. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ III. 構造的因果モデル(SCM)による統合 (1)

    因果グラフのSCMによる表現 (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり IV. 差分と構造の統合 --- Issueの総合的理解へ
  50. 潜在反応モデルと関数因果モデルと因果グラフ| 潜在反応モデルをDAGで表現してみると 畢竟、潜在反応モデルと関数因果モデルと バックドア基準の話はシームレスに繋がっている Y X Z1 Z2 Z3 バックドア基準に基づき、たとえばこの潜在反応モデ

    ルの例で調整する必要があるのはZ1だけ 潜在反応に実際のXの値が与えられて観測値Yとなる " = D, = = + (1 − )C たとえばXが0/1のときはこう書ける ( = ( , 1, 3) ) |1 ⊥ ⊥ 条件付き無視可能性
  51. 本⽇の内容 I. 構造から⾒た因果推論 :DAGとバックドア基準の⼊⾨ II. 差分から⾒た因果推論 :潜在反応モデル⼊⾨ III. 構造的因果モデル(SCM)による統合 (1)

    因果グラフのSCMによる表現 (2) 潜在反応モデルのSCMによる表現 (3) 潜在反応モデルとDAGとの繋がり IV. 差分と構造の統合 --- Issueの総合的理解へ
  52. 潜在反応 モデル メカニズムが ブラックボックス であるたぐいの 物理シミュレー ションモデル 因果効果推定アプローチの連続的な理論観(私⾒) 中間変数を介 す2段階回帰

    under フロントドア 基準 構造推定@ 経済学 X以外の共変量を バランシングして いくたぐいの = (処理, 外⽣変数) 重回帰 under バックドア 基準 RCT, 準実験 例えばスパコンで回す ような気候変動モデル 関数fと変数zについての モデル式の正当性に依存しない ただし、関数fと変数zの理論が なければ移設可能性の把握が困難 関数fと変数zについての モデル式の正当性に依存する 関数fと変数zの同等性の検討 により移設可能性を議論可能 祖先変数を介 す操作変数・ ⼆段階SLS 構造的因果モデルから帰納的/演繹的因果推論の全体を⾒る Full-of-Model Model-free X→Yの祖先-⼦孫 系列の効果伝搬を 演繹計算・集計し ていくたぐいの
  53. (2) 「Issueの総合的理解」における因果推論 ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔ 例:有機⽔銀汚染に対する環境リスク研究者の"頭の中” ޻৔Ͱͷ ੜ࢈աఔ

    ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ “Issue/problem-driven”の解析者と、”Method- driven”の解析者の”頭の中”は異なる Issue-drivenの解析者の 多くは常に頭の中に 何らかの "因果モデル"をもつ
  54. (2) 「Issueの総合的理解」における因果推論 105 どこに介⼊しうるのか/もし介⼊したらどうなるのかについてのアイデ アが常に頭の中をぐるぐるしている ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔

    ޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ ⼯場の⽣産過程を 変えれば有機⽔銀 の⽣成を抑えられ るのでは? 排⽔処理を変えれ ば有機⽔銀を除去 できるのでは? 禁漁により⼈への 曝露を防げるのは? 浚渫により汚染を 低減できるので は? 市場への流通を⽌めれば 市⺠への曝露は防げるのでは? 妊婦や⼦供などへの注意喚起により ハイリスクグループへの曝露を減ら せるのでは? 市場への流通を⽌める と⾃家消費により曝露 が増えるかも? 例:有機⽔銀汚染に対する環境リスク研究者の"頭の中”
  55. 「差異」と「構造」の繋がりが⾒えないと・・ 106 • 頭の中の"因果モデル"と「介⼊効果推定」の関係性は? 頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔

    ޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ (政策的対応を念頭においた) 介⼊効果推定 市場= 流通禁⽌ 市場= 流通あり 市⺠の 健康 市⺠の 健康 ここの差分 =介⼊効果 どちらかに思考のピントが合っているとき、もう⼀⽅はぼやけてしまう
  56. 「差異」と「構造」の繋がりが⾒えないと・・ 107 • 頭の中の"因果モデル"と「介⼊効果推定」の関係性は? 頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔

    ޻৔Ͱͷ ੜ࢈աఔ ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ (政策的対応を念頭においた) 介⼊効果推定 市場= 流通禁⽌ 市場= 流通あり 市⺠の 健康 市⺠の 健康 ここの差分 =介⼊効果 どちらかに思考のピントが合っているとき、もう⼀⽅はぼやけてしまう
  57. 108 両者にピントを合わせて思考できるようになってくる 頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔ ޻৔Ͱͷ ੜ࢈աఔ

    ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ (政策的規制措置等を念頭においた) 介⼊効果推定 do(市場= 流通禁⽌) do(市場= 流通あり) 市⺠の 健康 市⺠の 健康 ここの差分 =介⼊効果 両者の関係が⾒えるぞ・・・! 「差異」と「構造」の繋がりが⾒えてくると・・・
  58. 110 両者にピントを合わせて思考できるようになってくる 頭の中の"因果モデル" ༗ػਫۜ ͷੜ੒ ਫ࢈෺ ࢢຽ ࢢ৔ ޻৔Ͱͷ ੜ࢈աఔ

    ړࢣ ഉਫ ւͰͷ ੜ෺ೱॖ ւͰͷ Ԛછ஝ੵ (政策的規制措置等を念頭においた) 介⼊効果推定 do(市場= 流通禁⽌) do(市場= 流通あり) 市⺠の 健康 市⺠の 健康 ここの差分 =介⼊効果 両者の関係が⾒えるぞ・・・! 差異と構造の繋がりが⾒えてくると・・・
  59. 統計的因果推論と諸研究の関連性のイメージ 因果 モデル 関数fと変数Zのあり よう⾃体を分析対象 とした質的/量的研究 介⼊効果 推定 統計的 因果推論

    分析概念の/関数fと変数Zの モデルの⾼解像度化 バイアスの減少 Target/SUTVAの明確化 深化 効果の定量的な実証 量的な重要度の明確化 介⼊効果がいかに/どの程度⽣じるかについての “Sufficiently deep explanation”を社会に提供できる Morgan and Winship (2014) 「差がありました」の先の 「どうすればいいの?」に答えたい!
  60. 統計的因果推論で因果グラフを⽤いることの効⽤ ・ 調整すべき変数についての論理が得られる ・ 量的(統計的)研究と質的研究の橋渡しとなりうる ・ 調整すべき変数を絞り込むことができる ・ 感度分析・媒介効果分析への橋渡しとなりうる ・

    調整すべき変数の抜け漏れを防げる ・ 因果の図解⾃体が関係者とのやりとりに役⽴つ ・ ⼀般化可能性についての議論も深まりやすくなる(⼀般化可能性 は⽣成メカニズムの安定性や類似性にも⼤きく依存するため) ・ 識別可能性の前提条件の成⽴を検証するための視覚化 “Assumptions visualization tool” ・ 結果・処理・共変量の変数の概念的妥当性の吟味に役⽴つ “Issueの総合的理解”への⾒通しが開きやすい