因果探索という道具

Slide 1

Slide 1 text

因果探索という道具清水昌平滋賀大学データサイエンス学系理化学研究所革新知能統合研究センター

Slide 2

Slide 2 text

統計的因果推論 • データから因果関係を推測 • 介入するとどうなるか？ – チョコ消費量を変えるとノーベル賞受賞者の数は変わるのか – どのくらい増えるのか(減るのか) 2 Messerli, (2012), New England Journal of Medicine ! " # $ 賞受賞者 ( 数相関係数: 0.79 チョコレート消費量

Slide 3

Slide 3 text

通常の(?) 因果推論 1. 推定するものを決める: 介入効果 2. 背景知識を用いて因果構造を表すグラフを描く 3. どの変数(共通原因)で調整すべきかを理論から導く 4. (もしあれば) その変数を観測し調整に使い推定 3 チョコ賞 GDP 賞チョコ = 多い) = 調整に使う変数 [ 賞チョコ = 多い, 調整に使う変数)] 賞チョコ = 多い) − 賞 (チョコ = 少ない))

Slide 4

Slide 4 text

因果探索 • 因果構造を表すグラフ: 因果グラフ • データから描く • 背景知識とデータを両方使って因果グラフを描く 4 チョコ賞 ? チョコ賞 or GDP GDP チョコ賞 or GDP チョコ賞 GDP

Slide 5

Slide 5 text

5 因果推論の7つ道具ツール7. 因果探索

Slide 6

Slide 6 text

データから探索するためには仮定が必要 • いろいろな仮定ごとにいろいろな探索法 • 基本設定 – すべての共通原因が観測されている – グラフが非巡回 – 構造は未知 • 候補の中からデータと矛盾しないグラフを見つける 6 チョコ賞 ? チョコ賞 or GDP GDP チョコ賞 or GDP

Slide 7

Slide 7 text

関数形と分布の仮定 • 式で描くと • 構造方程式 • 関数! , " , # に仮定を入れるか • 誤差の分布(! ), (" ), (# )に仮定を入れるか 7 !: チョコ ": 賞 # : GDP 賞 = (チョコ, GDP, 誤差) ) = ) (* , + , ) )

Slide 8

Slide 8 text

応用例 8 疫学経済学 Sleep problems Depression mood Sleep problems Depression mood ? or OpInc.gr(t) Empl.gr(t) Sales.gr(t) R&D.gr(t) Empl.gr(t+1) Sales.gr(t+1) R&D(.grt+1) OpInc.gr(t+1) Empl.gr(t+2) Sales.gr(t+2) R&D.gr(t+2) OpInc.gr(t+2) (Moneta et al., 2012) (Rosenstrom et al., 2012) 神経科学化学 (Campomanes et al., 2014) (Boukrina & Graves, 2013)

Slide 9

Slide 9 text

「別の」応用: 予測モデルを解析 (Blobaum & Shimizu, 2017) • 介入して説明変数X1の値を変えると予測/ はどう変わる？ – X1を変えればX2, X3, X4も変わる – X1だけ違う値を入力してもダメ 9 ! " " # $ ! " # $ 予測モデル " 予測メカニズムのモデル ! " # $ 因果モデル ! = !(! の親, !) 0 = (", #, $, %) (0 | ! = )

Slide 10

Slide 10 text

関数形や分布には仮定をおかないアプローチ 1. 因果グラフに仮定をおく – 非巡回 – 未観測の共通原因なし(すべて観測されている) 2. 仮定を満たす構造の中で、データと(最も)つじつまの合うグラフを選ぶ 10 x y x y x y 「データでxとyが独立」なら、一番右の(c)を選ぶ (a)と(b)の区別がつかない(一意に決まらない): 同値類 3つの候補 (a) (b) (c)

Slide 11

Slide 11 text

同じ条件付き独立性を与える因果グラフの集合: 同値類 • 非巡回有向グラフ • 有向辺の有無は共通 • V字合流は共通 11 x3 x1 x2 x3 x1 x2 x3 x1 x2 x3 x2 x1 V字合流 x2とx3は独立しかし， x1で条件づけると従属

Slide 12

Slide 12 text

拡張など • 巡回グラフを含めた同値類 (Richardson96UAI) • 未観測共通原因を含めた同値類 (Spirtes+95UAI) • 介入効果の範囲 – M.H. Maathuis, M. Kalisch, and P. Bühlmann. Annals of Statistics, 2009 – D. Malinsky and P. Spirtes, International J. Approximate Reasoning, 2017 12 x y ｆ w z x y w z x y ｆ1 w z ｆ2 F. Eberhardt CRM Workshop 2016より

Slide 13

Slide 13 text

関数形や分布にも仮定を入れてみる • 条件付き独立性だけでなく分布の違いを利用 • 線形性＋非ガウス分布 • 向きをデータから調べることができる: 識別可能 13 x1 x2 x1 x2 観測変数x1,x2の分布が違う (条件付き独⽴性に違いはない) e1 e2 e1 e2

Slide 14

Slide 14 text

誤差変数! の非ガウス性と独立性がどう役立つか？ 14 2 1 21 2 1 1 e x b x e x + = = x1 x2 e1 e2 正しいモデル結果x2を原因x1に回帰原因x1を結果x2に回帰 2 1 21 2 1 1 1 2 2 ) 1 ( 2 ) var( ) , cov( e x b x x x x x x r = - = - = は独立と ) 1 ( 2 1 1 ) ( r e x = 残差 ( ) ) var( var ) var( ) , cov( 1 ) var( ) , cov( 2 1 21 1 2 2 1 21 2 2 2 1 1 ) 2 ( 1 x x b e x x x b x x x x x r - þ ý ü î í ì - = - = はと ) 2 ( 1 2 1 21 2 ) ( r e e b x + = 2 e 従属 0 21 ¹ b ガウスだと無相関＝独立

Slide 15

Slide 15 text

関数形に制約を⼊れたモデル • 連続変数 – 線形＋⾮ガウス誤差 (Shimizu+06JMLR) • $ = ∑ %$ の親 $& & + $ – ⾮線形モデル (Hoyer+08NIPS, Zhang+09UAI, Peters+14JMLR) • $ = $($ の親) + $ • $ = $ '!($ ($ の親) + $ ) • 離散変数と連続変数が混在 • ロジスティック＋線形非ガウス • 2変数の場合の識別性 (Wenjuan et al., IJCAI2018) • 数値実験 (Li & Shimizu, 2018) 15

Slide 16

Slide 16 text

未観測共通原因あり (Maeda & Shimizu, 2020) • 未観測共通原因のありそうな変数ペア • 未観測共通原因がない変数ペアの因果の向き 16 # ! ! " Underlying model Output ( # ! " ( #

Slide 17

Slide 17 text

i i j j ij Q q q iq i e x b f x + + = å å ¹ =1 l 未観測共通原因があっても向きを推定 (Hoyer+08IJAR, Salehkaleybar+20JMLR) • 未観測共通原因$を追加 (非ガウス) 17 ただしは独⽴(WLG) ) , , 1 ( Q q f q ! = x1 x2 2 e 1 e 1 f 2 f • 推定 • 最尤推定 (Hoyer+08IJAR) • ベイズ推定 (Henao+10JMLR; Shimizu+14JMLR)

Slide 18

Slide 18 text

因果グラフに関する背景知識の利用 • 因果グラフの妥当性の検証 – “一番上(下)”の変数が“一番上(下)”にくるか • 背景情報+データから因果グラフを推測 – 製造業 • 製造条件 • その中間の特性 • 最終的な特性: 不良率など – 農業やマーケティングなどでも • 実験・調査の効率化 18 最終特性条件1 条件10 中間特性1 中間特性100 … 中間特性82 中間特性8 中間特性66 中間特性66 中間特性16 … … … … 因果探索

Slide 19

Slide 19 text

Python toolbox https://github.com/cdt15/lingam 19 • ICA-based LiNGAM algorithm • DirectLiNGAM • AR-LiNGAM and VARMA-LiNGAM • LiNGAM for multiple datasets • (Bottomup-)ParceLiNGAM • ANM (beta version) Planning to implement more JNQPSUMJOHBN GSPNHSBQIWJ[JNQPSU%JHSBQI OQTFU@QSJOUPQUJPOT QSFDJTJPO TVQQSFTT5SVF TFFE FQTF σʔλΛ࡞੒ EFGNBLF@HSBQI EBH E%JHSBQI FOHJOFEPU JGDPFGJOEBH GPSGSPN@ UP DPFGJO[JQ EBH<GSPN> EBH<UP> EBH<DPFG> EFEHF GY\GSPN@^ GY\UP^ MBCFMG\DPFGG^ FMTF GPSGSPN@ UPJO[JQ EBH<GSPN> EBH<UP> EFEHF GY\GSPN@^ GY\UP^ MBCFM SFUVSOE x3 x0 3.00 x2 6.00 x5 4.00 x4 8.00 x1 3.00 1.00 2.00 EBH\ GSPN< > UP< > DPFG< > ^ NBLF@HSBQI EBH ブートストラップ確率因果グラフ

Slide 20

Slide 20 text

おわりに • 因果探索は因果仮説を探索 – どんな状況でどの変数がどの変数にどのくらいの介入効果をもつのか • 今後 – 背景知識とデータを組み合わせて因果グラフを推測 – 柔軟に仮定を選べるように • 改善点、例えば – 離散と連続の混在、未観測共通原因、推定精度の改善、欠測値への対応、ソフトウェア、適用事例などなど 20

Slide 21

Slide 21 text

Slide 22

Slide 22 text

時系列: 時間情報あり • SVAR: 構造型自己回帰モデル (Swanson & Granger, 1997) – 非ガウス独立 (Hyvarinen et al., 2010, JMLR) • 「間」を復元 (Gong et al., ICML15) ) ( ) ( ) ( 0 t t t k e x B x + - = å = t t t 22 Moneta+12, Oxford Bulletin of Economics and Statistics (t) (t) (t) R&D(t) (t+1) (t+1) R&D(t+1) (t+1) (t+2) (t+2) R&D(t+2) (t+2) Growth rate = log( x(t) ) – log ( x(t-1) )

Slide 23

Slide 23 text

巡回モデル (Lacerda et al., 2008; Hyvarinen & Smith, 2013) • ループありのモデル: • 識別性の十分条件 – Bの固有値の絶対値が１より小さい(平衡状態にある) – ループが交わらない – 自己ループなし x1 x2 e1 e2 x5 e5 x4 e4 x3 e3 23 i i j j ij i e x b x + = å ¹