Pearl「入門統計的因果推論4.5」まとめ

Slide 1

Slide 1 text

入門統計的因果推論4.5 介入と寄与の分析に関する数学的ツール

Slide 2

Slide 2 text

アジェンダ - 自己紹介 - 4章の（ざっっっくりとした）復習 - 介入と寄与の分析に関する数学的ツール - 練習問題

Slide 3

Slide 3 text

自己紹介

Slide 4

Slide 4 text

自己紹介（パーソナリティ）名前: 宇戸慎吾（うとしんご）趣味: シーシャ得意: Twitter 苦手: IT, 数学, 英語（笑）カラオケキックボクシング

Slide 5

Slide 5 text

自己紹介（宣伝） - Envaderというサービスの企画・運営してます - Pythonで因果推論手法を実装するzennの記事を書いてます - たまに登壇してます（登壇資料）

Slide 6

Slide 6 text

4章の復習

Slide 7

Slide 7 text

反事実とは（イメージ）車で分岐点 - セプルベタ ▶ 選択: 運転時間1h（事実） - フリーウェイフリーウェイを選択していたときの運転時間は...？（反事実）

Slide 8

Slide 8 text

反事実とは（問題点）フリーウェイを選択していた場合の運転時間（反事実）を do表記法を用いて表現しようとすると... E( 運転時間 | do(フリーウェイ), 運転時間=1h ) → do表記法では表現できない conflict!!

Slide 9

Slide 9 text

反事実とは（じゃあどうすんの）添字を使って表現 E(Y フリーウェイ | セプルベタ, Y = Y セプルベタ = 運転時間1h) 仮想した世界実際の世界異なる2つの世界

Slide 10

Slide 10 text

反事実とは（基本法則） - 正式な定義: Y x (u) = Y Mx (u) … (4.5) - 一致性: もし X = x ならば Y x = Y … (4.6) ここで、M x は任意の構造モデル Mを修正してXの等式をX=xに置き換えたものこの基本法則に従って反事実を考えることで、ある特定の個体(U=u)の振る舞いを捉えることが可能

Slide 11

Slide 11 text

反事実とは（ココがすごい）構造的因果モデルにより完全に記述されたどのようなモデルにおいても反事実の確率を計算できるモデルの記述が不完全 or変数がいくつか測定できていない時でもデータからこれらの確率を計算することができる X = aU, Y = bX + U Y x (u) = Y Mx (u) = bx + u 証拠E=eからUの値を決定 X=xとし修正モデルM x を得る（決定論的モデルの例）パラメトリックなモデルが存在モデルから Uを推論可能母集団レベルにおいては、調整化公式により確率や期待値を計算することができる Yes No

Slide 12

Slide 12 text

反事実とは（まとめ） - 事実とは異なる「もし〜していたら...」を考えるアプローチ - do表記法では表現できないため、添字を利用 - 構造的因果モデルやデータから確率や期待値について計算することができる

Slide 13

Slide 13 text

介入と寄与の分析に関する数学的ツール

Slide 14

Slide 14 text

3つの頻出パターン 1. ETT(Effect of Treatment on the Treated) ➢ 前章で解説 2. 必要性の確率(PN: Probability of Necessity) ➢ 4.5.1 原因と確率と寄与に関するツールで解説 3. 媒介問題 ➢ 4.5.2 媒介についてのツールで解説

Slide 15

Slide 15 text

1. ETT(Effect of Treatment on the Treated) 2. 必要性の確率(PN: Probability of Necessity) 3. 媒介問題 3つの頻出パターン

Slide 16

Slide 16 text

ETTの復習 - Effect of Treatment on the Treated（処置群での処置効果） - ETT = E[ Y x - Y x’ | X=x ] = E[ Y x | X=x ] - E[ Y x’ | X=x ] ETTが識別可能となるのは以下の 3通り 1. バックドア基準を満たす 2. フロントドア基準を満たす 3. 2値変数Xで実験データと非実験データがそれぞれP(Y=y|do(X=x))とP(X=x, Y=y)の形で手に入る

Slide 17

Slide 17 text

3つの頻出パターン 1. ETT(Effect of Treatment on the Treated) 2. 必要性の確率(PN: Probability of Necessity) 3. 媒介問題

Slide 18

Slide 18 text

PN（必要性の確率）とは Probability of Necessityの略。2値の事象を仮定し - X=x は介入（X=x’ は X=x の否定） - Y=y は反応（Y=y’ は Y=y の否定）とするとき、求めたい反事実の量は PN(x, y) = P( Y x’ =y’ | X=x, Y=y ) 上記のPNは、実際にはX=x, Y=yですが、もしX=x’であったならばY=y’であろう確率を表してます

Slide 19

Slide 19 text

PNの識別可能性（定理4.5.1）過剰相対リスク（ERR: Excess Risk Ratio）交絡バイアスの修正項（CF: Confounding Factor）（4.28）（4.29）

Slide 20

Slide 20 text

PNのお気持ち自動車会社UTO（仮名）が「車の設計に落ち度があったために自動車事故で人が死んでしまった」と訴えられたケースを考える自動車会社UTOの車を運転すると死亡する確率がどれほど高くなるかもし自動車会社UTOの車を買う人たちは一般の運転者よりもスピードを出す傾向にある場合には、そのバイアスを修正（4.29）

Slide 21

Slide 21 text

PNの下限と上限（4.30）式4.28 翻訳がイマイチなので確認 CAUSAL INFERENCE IN STATISTICS（pdf版）を参照 ※式4.30の詳細は「Tien and Pearl 2000」を参照

Slide 22

Slide 22 text

PNの下限と上限（式変形）（4.31）（4.32）（4.33）（4.34）

Slide 23

Slide 23 text

PNの下限と上限（3つの特徴） PNの下限と上限をERRの関数として描画 1. 交絡の有無に依らず UB - LB = q = P(y’|x) / P(y|x) （一定） 2. ERRのみでは十分でない場合に、CFは PN>1/2を満たすために下限を上昇させるかもしれない 3. 上下限の上昇量はCFによって与えられる観察可能唯一、実験データから推定する必要あり

Slide 24

Slide 24 text

PNの下限と上限（PSとPNS） - PS(Probability of Sufﬁciency) - PS = P(Y x =y | X=x’, Y=y’) - PNS(Probability of Necessity and Sufﬁciency) - PNS = P(Y x =y, Y x’ =y’) についても同様に上下限を求めることができる特に、Y x (u)が単調の場合 PNS = P(Y x =y, Y x’ =y’)= P(Y x =y, Y x’ =y) = P(Y x =y) - P(Y x’ =y) ※詳細は「Tien and Pearl 2000」を参照

Slide 25

Slide 25 text

PNの具体例腰痛の薬xが腰痛患者Aさんの死亡原因であるのか？実験データ非実験データ do(x) do(x’) x x’ 死（y） 16 14 2 28 生存（y’） 984 986 998 972 手元にある実験データおよび非実験データから薬 xが人の死yの原因である確率PNを推定する表から - P(y|do(x)) = 16/1000 = 0.016 - P(y|do(x’)) = 14/1000 = 0.014 - P(y) = 30/2000 = 0.015 - P(x,y) = 2/2000 = 0.001 - P(y|x) = 2/1000 = 0.002 - P(y|x’) = 28/1000 = 0.028 が得られる ※標本誤差はないものとする

Slide 26

Slide 26 text

PNの具体例腰痛の薬xが腰痛患者Aさんの死亡原因であるのか？実験データ非実験データ do(x) do(x’) x x’ 死（y） 16 14 2 28 生存（y’） 984 986 998 972 手元にある実験データおよび非実験データから薬 xが人の死yの原因である確率PNを推定する単調性を仮定すると、定理4.5.1の4.29式より式4.30の下限は1となるので PN=1 ➢ 確実に死の原因と言える ※標本誤差はないものとする

Slide 27

Slide 27 text

PNのまとめ - PNとは「実際にはX=x, Y=yだが、もしX=x’であったならばY=y’であろう」確率 - PNが識別可能な条件は下記の通り - すべてのuでYがXについて単調（Y 1 (u) >= Y 0 (u)） - 因果効果P(y|do(x))が識別可能 - PNが識別可能なとき、PNはERRとCFに分解でき、ERRは観察データから、CFは実験データから推定することが可能

Slide 28

Slide 28 text

3つの頻出パターン 1. ETT(Effect of Treatment on the Treated) 2. 必要性の確率(PN: Probability of Necessity) 3. 媒介問題

Slide 29

Slide 29 text

媒介とは（概要）ある変数Tが別の変数Yに影響を与えるとき、その影響の与え方は下記の2通りが考えられる (1) 直接効果: T → Y (2) 間接効果: T → M → Y 資格M 性別T 採用Y 媒介変数 Mを媒介した効果 (1) (2) (2)

Slide 30

Slide 30 text

媒介とは（具体例: 3.7章を参照）ある会社が人材採用Yにおいて性別Tによる差別があるかどうかの直接効果を知りたい。ただし、性別Tは資格についての変数Mを媒介変数として間接的に採用に影響を与えているかもしれない。資格Mについて固定して効果を計測したら解決するのでは ...？

Slide 31

Slide 31 text

媒介とは（グラフによるアプローチ1）こんなグラフであれば、Mを固定するだけでOK 資格M 性別T 採用Y 資格M=m 性別T 採用Y M=mに固定

Slide 32

Slide 32 text

媒介とは（グラフによるアプローチ2） MとYの間に交絡因子が存在すると話は変わる資格M 性別T 採用Y 資格M=m 性別T 採用Y M=mに固定親の収入I 親の収入I ▶ CDE(Controlled Direct Effect)を考える

Slide 33

Slide 33 text

間接効果（T→M→Y）を求めるのは、直接効果（T→Y）を求めるよりも難しい - 条件付けとかで何とかならないの？ ➢ どう条件付けしても、直接効果T→Yだけを取り除くことができない - 間接効果 = 総合効果 - 直接効果じゃダメなの？ ➢ 線形システムであれば問題ないが、非線形システムでは成り立たない媒介とは（間接効果を考える）

Slide 34

Slide 34 text

よくある媒介問題のモデル媒介問題の標準的なモデル t = f T (u T ), m = f M (t, u M ), y = f Y (t, m, u Y ) …（4.43）ただし、 - T（処置）, M（媒介）, Y（反応）は確率変数（離散 or連続） - fは任意の関数 - Uは省略変数 - ベクトルU = (U T , U M , U Y )は確率ベクトル（個体間のばらつきを表す）

Slide 35

Slide 35 text

よくある媒介問題のモデル（グラフ）交絡なし U M M U T U Y T Y 交絡あり U M と(U T , U Y )の間に従属性がある U M M U T U Y T Y

Slide 36

Slide 36 text

反事実における効果の定義効果定義解釈媒介変数の挙動総合効果 TE: Total Effect 処置がT=0からT=1に変化した時のYの増加量の期待値 Tが変化するにつれて関数f M により自然に変化する制御された直接効果 CDE: Controlled Direct Effect 処置がT=0からT=1に変化した時のYの増加量の期待値母集団全体に対して一律 M=m に設定自然な直接効果 NDE: Natural Direct Effect 処置がT=0からT=1に変化した時のYの増加量の期待値 T=0においてそれぞれの個体がとったであろう値に固定自然な間接効果 NIE: Natural Indirect Effect 処置がT=0に固定されているときのYの増加量の期待値 T=1においてそれぞれの個体がとったであろう値に固定 TEとCDEはdoオペレーターで記述することができ、データから推定することができる。 NDEと NIEを識別するためには別の仮定が必要になる。

Slide 37

Slide 37 text

総合効果の分解一般に総合効果TEは下記の通り分解することができる TE = NDE - NIE r … （4.48）ここで、NIE r はT=1からT=0へ逆向きの移行をしたときのNIE ➢ NDEとTEが識別可能であれば、NIEも識別可能

Slide 38

Slide 38 text

自然な効果を識別するための条件

Slide 39

Slide 39 text

NDEの識別（定理4.5.2）式4.49内のdo表記の識別可能性は条件A-3, A-4が保証してくれており、バックドアorフロントドア基準により計算可能です！（4.49）

Slide 40

Slide 40 text

NDEの識別（系4.5.1）（∵式4.48）（4.50）（4.51）（4.52）媒介公式 CDEの重み付き平均と解釈できる（∵定義+非交絡）

Slide 41

Slide 41 text

TE・NDE・NIEを用いた3つの比 NDE / TE : Mを”凍結”したまま直接伝搬する反応の割合 (TE - NDE) / TE : 反応のうちMによるものの割合 NIE / TE : YがXに影響されないとき、 Mを経由して伝搬する反応の割合

Slide 42

Slide 42 text

媒介公式の具体例宿題・補習への取り組みと試験の合否（合格率）処置宿題合格率 T M E[Y|T=t,M=m] 1 1 0.80 1 0 0.40 0 1 0.30 0 0 0.20 処置宿題 T E[M|T=t] 0 0.40 1 0.75 表から - NDE = (0.4 - 0.2)(1 - 0.4) + (0.8 - 0.3)0.4 = 0.32 - NIE = (0.75 - 0.4)(0.3 - 0.2) = 0.035 - TE = 0.8*0.75 + 0.4*0.25 - (0.3*0.4 + 0.2*0.6) = 0.46 - NIE / TE = 0.07 - NDE / TE = 0.696 - (TE - NDE) / TE = 0.304 プログラムにより宿題に時間をかけるようになった結果合格率の増加（30.4%）宿題の時間に増加のみの合格率の増加（7%）プログラム全体の合格率の増加（ 46%）

Slide 43

Slide 43 text

媒介問題のまとめ - 反事実における効果はTE, CDE, NDE, NIEの4つ - TEとCDEはdo表記されているため実験データor観察調査から推定可能であるが、NDEとNIEは別途4つの識別条件が必要 - 共変量が非交絡のとき媒介公式からNDEとNIEを計算することができる

Slide 44

Slide 44 text

練習問題

Slide 45

Slide 45 text

4.5.1(1/2) Jonesさんは放射線治療を受けるべきであったか？

Slide 46

Slide 46 text

4.5.1(2/2) Jonesさんは放射線治療を受けるべきであったか？無理やり解答っぽくしていますが、 P(x,y)が分かりませんでした ...分かった人教えて ...

Slide 47

Slide 47 text

4.5.2 構造モデルのTE, NDE, NIEを求める (a) (b) U Y = aU M + b と置いて(a)と同様に計算するだけ。答えは(a)と同じになります！ M T Y U M U Y 線形モデルなので TE = NDE + NIE

Slide 48

Slide 48 text

4.5.3(a) 下記の構造モデルを考える T M Y W 解答するために勝手に仮定しました

Slide 49

Slide 49 text

4.5.3(b) 下記の構造モデルを考える T M W Y 解答するために勝手に仮定しました

Slide 50

Slide 50 text

4.5.4 性別・資格と採用（採用率）性別資格採用率 T M E[Y|T=t,M=m] 1 1 0.80 1 0 0.40 0 1 0.30 0 0 0.20 性別資格 T E[M|T=t] 0 0.40 1 0.75 表から - NDE = (0.4 - 0.2)(1 - 0.4) + (0.8 - 0.3)0.4 = 0.32 - NIE = (0.75 - 0.4)(0.3 - 0.2) = 0.035 - TE = 0.8*0.75 + 0.4*0.25 - (0.3*0.4 + 0.2*0.6) = 0.46 - NIE / TE = 0.07 - NDE / TE = 0.696 - (TE - NDE) / TE = 0.304 男性が資格を持っている場合の採用率の増加（30.4%）資格のみによる採用率の増加（7%）全体の採用における性差（ 46%）男性が資格を持っていることによる採用率の増加（30.4%）

Slide 51

Slide 51 text

ご清聴ありがとうございました