Upgrade to Pro — share decks privately, control downloads, hide ads and more …

因果探索という道具

 因果探索という道具

一般社団法人データサイエンティスト協会 7thシンポジウム , オンライン

Shohei SHIMIZU

November 09, 2020
Tweet

More Decks by Shohei SHIMIZU

Other Decks in Technology

Transcript

  1. 通常の(?) 因果推論 1. 推定するものを決める: 介入効果 2. 背景知識を用いて因果構造を表すグラフを描く 3. どの変数(共通原因)で調整すべきかを理論から導く 4.

    (もしあれば) その変数を観測し調整に使い推定 3 チョコ 賞 GDP 賞 チョコ = 多い) = 調整に使う変数 [ 賞 チョコ = 多い, 調整に使う変数)] 賞 チョコ = 多い) − 賞 (チョコ = 少ない))
  2. データから探索するためには仮定が必要 • いろいろな仮定ごとにいろいろな探索法 • 基本設定 – すべての共通原因が観測されている – グラフが非巡回 –

    構造は未知 • 候補の中からデータと矛盾しないグラフを見つける 6 チョコ 賞 ? チョコ 賞 or GDP GDP チョコ 賞 or GDP
  3. 関数形と分布の仮定 • 式で描くと • 構造方程式 • 関数! , " ,

    # に仮定を入れるか • 誤差の分布(! ), (" ), (# )に仮定を入れるか 7 !: チョコ ": 賞 # : GDP 賞 = (チョコ, GDP, 誤差) ) = ) (* , + , ) )
  4. 応用例 8 疫学 経済学 Sleep problems Depression mood Sleep problems

    Depression mood ? or OpInc.gr(t) Empl.gr(t) Sales.gr(t) R&D.gr(t) Empl.gr(t+1) Sales.gr(t+1) R&D(.grt+1) OpInc.gr(t+1) Empl.gr(t+2) Sales.gr(t+2) R&D.gr(t+2) OpInc.gr(t+2) (Moneta et al., 2012) (Rosenstrom et al., 2012) 神経科学 化学 (Campomanes et al., 2014) (Boukrina & Graves, 2013)
  5. 「別の」応用: 予測モデルを解析 (Blobaum & Shimizu, 2017) • 介入して説明変数X1の値を変えると予測/ はどう変わる? –

    X1を変えればX2, X3, X4も変わる – X1だけ違う値を入力してもダメ 9 ! " " # $ ! " # $ 予測モデル " 予測メカニズムのモデル ! " # $ 因果モデル ! = !(! の親, !) 0 = (", #, $, %) (0 | ! = )
  6. 同じ条件付き独立性を与える 因果グラフの集合: 同値類 • 非巡回有向グラフ • 有向辺の有無は共通 • V字合流は共通 11

    x3 x1 x2 x3 x1 x2 x3 x1 x2 x3 x2 x1 V字合流 x2とx3は独立 しかし, x1で条件づける と従属
  7. 拡張など • 巡回グラフを含めた同値類 (Richardson96UAI) • 未観測共通原因を含めた同値類 (Spirtes+95UAI) • 介入効果の範囲 –

    M.H. Maathuis, M. Kalisch, and P. Bühlmann. Annals of Statistics, 2009 – D. Malinsky and P. Spirtes, International J. Approximate Reasoning, 2017 12 x y f w z x y w z x y f1 w z f2 F. Eberhardt CRM Workshop 2016より
  8. 誤差変数! の非ガウス性と独立性が どう役立つか? 14 2 1 21 2 1 1

    e x b x e x + = = x1 x2 e1 e2 正しいモデル 結果x2を原因x1に回帰 原因x1を結果x2に回帰 2 1 21 2 1 1 1 2 2 ) 1 ( 2 ) var( ) , cov( e x b x x x x x x r = - = - = は独立 と ) 1 ( 2 1 1 ) ( r e x = 残差 ( ) ) var( var ) var( ) , cov( 1 ) var( ) , cov( 2 1 21 1 2 2 1 21 2 2 2 1 1 ) 2 ( 1 x x b e x x x b x x x x x r - þ ý ü î í ì - = - = は と ) 2 ( 1 2 1 21 2 ) ( r e e b x + = 2 e 従属 0 21 ¹ b ガウスだと 無相関=独立
  9. 関数形に制約を⼊れたモデル • 連続変数 – 線形+⾮ガウス誤差 (Shimizu+06JMLR) • $ = ∑

    %$ の親 $& & + $ – ⾮線形モデル (Hoyer+08NIPS, Zhang+09UAI, Peters+14JMLR) • $ = $($ の親) + $ • $ = $ '!($ ($ の親) + $ ) • 離散変数と連続変数が混在 • ロジスティック+線形非ガウス • 2変数の場合の識別性 (Wenjuan et al., IJCAI2018) • 数値実験 (Li & Shimizu, 2018) 15
  10. i i j j ij Q q q iq i

    e x b f x + + = å å ¹ =1 l 未観測共通原因があっても向きを推定 (Hoyer+08IJAR, Salehkaleybar+20JMLR) • 未観測共通原因$を追加 (非ガウス) 17 ただし は独⽴(WLG) ) , , 1 ( Q q f q ! = x1 x2 2 e 1 e 1 f 2 f • 推定 • 最尤推定 (Hoyer+08IJAR) • ベイズ推定 (Henao+10JMLR; Shimizu+14JMLR)
  11. 因果グラフに関する背景知識の利用 • 因果グラフの妥当性の検証 – “一番上(下)”の変数が“一番上(下)”にくるか • 背景情報+データから因果グラフを推測 – 製造業 •

    製造条件 • その中間の特性 • 最終的な特性: 不良率など – 農業やマーケティングなどでも • 実験・調査の効率化 18 最終特性 条件1 条件10 中間特性1 中間特性100 … 中間特性82 中間特性8 中間特性66 中間特性66 中間特性16 … … … … 因果探索
  12. Python toolbox https://github.com/cdt15/lingam 19 • ICA-based LiNGAM algorithm • DirectLiNGAM

    • AR-LiNGAM and VARMA-LiNGAM • LiNGAM for multiple datasets • (Bottomup-)ParceLiNGAM • ANM (beta version) Planning to implement more JNQPSUMJOHBN GSPNHSBQIWJ[JNQPSU%JHSBQI OQTFU@QSJOUPQUJPOT QSFDJTJPO TVQQSFTT5SVF TFFE FQTF σʔλΛ࡞੒ EFGNBLF@HSBQI EBH  E%JHSBQI FOHJOFEPU JGDPFGJOEBH GPSGSPN@ UP DPFGJO[JQ EBH<GSPN> EBH<UP> EBH<DPFG>  EFEHF GY\GSPN@^ GY\UP^ MBCFMG\DPFGG^ FMTF GPSGSPN@ UPJO[JQ EBH<GSPN> EBH<UP>  EFEHF GY\GSPN@^ GY\UP^ MBCFM SFUVSOE x3 x0 3.00 x2 6.00 x5 4.00 x4 8.00 x1 3.00 1.00 2.00 EBH\ GSPN<      > UP<      > DPFG<      > ^ NBLF@HSBQI EBH ブートストラップ確率 因果グラフ
  13. おわりに • 因果探索は因果仮説を探索 – どんな状況でどの変数がどの変数に どのくらいの介入効果をもつのか • 今後 – 背景知識とデータを組み合わせて因果グラフを推測

    – 柔軟に仮定を選べるように • 改善点、例えば – 離散と連続の混在、未観測共通原因、推定精度の改善、 欠測値への対応、ソフトウェア、適用事例などなど 20
  14. 21

  15. 時系列: 時間情報あり • SVAR: 構造型自己回帰モデル (Swanson & Granger, 1997) –

    非ガウス独立 (Hyvarinen et al., 2010, JMLR) • 「間」を復元 (Gong et al., ICML15) ) ( ) ( ) ( 0 t t t k e x B x + - = å = t t t 22 Moneta+12, Oxford Bulletin of Economics and Statistics (t) (t) (t) R&D(t) (t+1) (t+1) R&D(t+1) (t+1) (t+2) (t+2) R&D(t+2) (t+2) Growth rate = log( x(t) ) – log ( x(t-1) ) 
  16. 巡回モデル (Lacerda et al., 2008; Hyvarinen & Smith, 2013) •

    ループありのモデル: • 識別性の十分条件 – Bの固有値の絶対値が1より小さい(平衡状態にある) – ループが交わらない – 自己ループなし x1 x2 e1 e2 x5 e5 x4 e4 x3 e3 23 i i j j ij i e x b x + = å ¹