Upgrade to Pro — share decks privately, control downloads, hide ads and more …

非ガウス性と非線形性に基づく統計的因果探索

Shohei SHIMIZU
November 06, 2024

 非ガウス性と非線形性に基づく統計的因果探索

統計的因果推論研究の最先端, 愛媛大学, 愛媛

Shohei SHIMIZU

November 06, 2024
Tweet

More Decks by Shohei SHIMIZU

Other Decks in Research

Transcript

  1. 自己紹介 ◼現職 • 滋賀大学 データサイエンス学系 教授 • (兼業) 理化学研究所 革新知能統合研究センター

    因果推論チーム チームリーダー ◼専門分野 • 統計的因果推論・統計学・機械学習 • 因果探索の理論と方法 • LiNGAM法の提案 ◼宣伝 • 理研ポスドク・RAに興味のある人いたらぜひ 2 清水, 統計的因果探索, 講談社, 2017 Shimizu, Statistical Causal Discovery: LiNGAM approach, Springer, 2022
  2. 統計的因果推論 ◼予測 • チョコ消費量がこのくらいなら ノーベル賞の数はどのくらい? ◼因果 • チョコ消費量を増やすと (介入) ノーベル賞の数は増える?

    ◼無作為化実験がGold Standard ◼無作為化実験により データを集めるのは困難 ◼それ以外の観察データを活用 3 Messerli, (2012), New England Journal of Medicine ノ ー ベ ル 賞 受 賞 者 の 数 相関係数: 0.79 チョコレート消費量
  3. 因果推論の手順の典型例 1. 推定したいものを決める: 介入効果 2. 領域知識を用いて因果構造を表すグラフを描く 3. どの変数を分析に含めるかを、数学的理論から導く 4. (もしあれば)

    その変数も観測し分析に含めて、推定 4 チョコ 賞 GDP 因果グラフ ◼因果グラフを描くだけの領域知識がないことは多い ◼因果探索: データを用いて因果グラフを推測 共通原因
  4. LiNGAMモデル (Shimizu, Hyvarinen, Hoyer & Kerminen, 2006) ◼Linear Non-Gaussian Acyclic

    Model • 誤差変数 𝑒𝑖 は非ガウス連続で独立 • 未観測の共通原因なし ◼因果グラフ (と係数)をデータから一意に推定可能 • 観測変数間の(条件つき)独立性に加えて 親と誤差変数の独立性も利用 7 LiNGAM 𝑥𝑖 = ෍ 𝑗: 𝑥𝑖 の親 𝑏𝑖𝑗 𝑥𝑗 + 𝑒𝑖 𝑏21 𝑏23 𝑏13 𝑥1 𝑥3 𝑥2 𝑥1 𝑥3 𝑥2 従来 行列で書くと: 𝒙 = 𝐁𝒙 + 𝒆
  5. 非ガウス性と独立性をどう使うか? 8 𝑥1 𝑥2 𝑒1 𝑒2 正しいモデル 結果𝑥2 を原因𝑥1 に回帰

    原因𝑥1 を結果𝑥2 に回帰 2 1 21 2 1 1 1 2 2 ) 1 ( 2 ) var( ) , cov( e x b x x x x x x r = − = − = は独立 と ) 1 ( 2 1 1 ) ( r e x = 残差 ( ) ) var( var ) var( ) , cov( 1 ) var( ) , cov( 2 1 21 1 2 2 1 21 2 2 2 1 1 ) 2 ( 1 x x b e x x x b x x x x x r −       − = − = は と ) 2 ( 1 2 1 21 2 ) ( r e e b x + = 2 e 従属 ガウスだと 無相関=独立 𝑥1 = 𝑒1 𝑥2 = 𝑏21 𝑥1 + 𝑒2 𝑏21 ≠ 0
  6. 各種拡張(1) https://www.shimizulab.org/lingam/lingampapers 9 共通原因が未観測の場合 Hoyer+(2008), Salehkaleybar+(2020) 𝑥2 𝑥1 𝑢1 因果順序が識別可能

    未観測共通原因 𝑥𝑖 = ෍ 𝑗: 𝑥𝑖 の親 𝑏𝑖𝑗 𝑥𝑗 + ෍ 𝑘: 𝑥𝑖 の親 𝜆𝑖𝑘 𝑢𝑘 + 𝑒𝑖 潜在因子間の因果探索 Shimizu+(2008), Xie+(2020) 𝑥3 𝑥4 𝑓2 測定モデルが識別可能なら 因果グラフと係数が識別可能 潜在因子 𝒇 = 𝐁𝒇 + 𝒆 𝒙 = 𝐁𝒙 + 𝒆 未観測共通原因も潜在因子もあり Adams+(2021), Huang+(2022), Xie+(2024) 潜在クラス Shimizu+(2008) 𝑥2 𝑥1 𝑓1 Xie+(2024) 𝑝 𝒙 𝜽 = ෍ 𝑘=1 𝐾 𝑝(𝒙 𝝁𝑘 , 𝐁𝑘 𝑝(𝑐𝑙𝑎𝑠𝑠 = 𝑘) 𝒙 = 𝐁𝑘 𝒙 + 𝐈 − 𝐁𝑘 𝝁𝑘 + 𝒆𝑘
  7. 各種拡張(2) https://www.shimizulab.org/lingam/lingampapers 10 非線形で未観測共通原因がある場合 Maeda+(2021), Maeda+(2024) 𝑥𝑖 = ෍ 𝑗:

    𝑥𝑖 の親 𝑓𝑖𝑗 (𝑥𝑗 ) + ෍ 𝑘: 𝑥𝑖 の親 𝑔𝑖𝑘 (𝑢𝑘 ) + 𝑒𝑖 𝑥4 𝑥1 𝑥2 𝑥3 向き・ 交絡の「存在」 が識別可能 非線形の場合 Hoyer+(2008), Zhang+(2009), Buhlmann+(2014) 𝑥𝑖 = 𝑓𝑖 ( 𝑥𝑖 の親) +𝑒𝑖 𝑥𝑖 = 𝑓𝑖,2 −1(𝑓𝑖,1 ( 𝑥𝑖 の親) +𝑒𝑖 ) 𝑥𝑖 = ෍ 𝑗: 𝑥𝑖 の親 𝑓𝑖𝑗 (𝑥𝑗 ) +𝑒𝑖 時系列の場合 Hyvarinen+(2008), Kikuchi+(2023), Maeda+(2024) 𝑥2 (𝑡 − 1) 𝑥1 (𝑡 − 1) 𝑥𝑖 (𝑡) = ෍ 𝑗,𝜏: 𝑥𝑖 の親 𝑓 𝑖𝑗 𝜏 (𝑥𝑗 𝑡 − 𝜏 ) + ෍ 𝑘, 𝜔: 𝑥𝑖 の親 𝑔 𝑖𝑘 𝜔 (𝑢𝑘 (𝑡 − 𝜔)) + 𝑒𝑖 (𝑡) 向き・ 交絡の「存在」 が識別可能 𝑥2 (𝑡) 𝑥1 (𝑡) 巡回の場合 Lacerda+(2008) 𝒙 = 𝐁𝒙 + 𝒆 Stabilityを仮定: 𝐁の固有値の絶対値 ≤ 1 𝑥4 𝑥1 𝑥2 𝑥3 𝑥2
  8. DirectLiNGAMアルゴリズム (Shimizu et al., 2011) ◼LiNGAMモデルの推定アルゴリズム ◼因果的順序を上から下へ順に推定 • 1番上を見つけて、残差を計算 •

    残差もLiNGAMモデル: 因果関係は変わらない 12           +                     − =           2 1 3 2 1 3 2 1 3 0 3 . 1 0 0 0 5 . 1 0 0 0 e e e x x x x x x 0 0 0 0 0 0 0 0       +             − =       2 1 ) 3 ( 2 ) 3 ( 1 ) 3 ( 2 ) 3 ( 1 0 3 . 1 0 0 e e r r r r 0 0 ) 3 ( 2 r ) 3 ( 1 r 𝑥3 𝑥1 𝑥2 0
  9. ◼𝑥𝑗 は最初: どの変数の子にもならない ◼どの残差とも独立な変数が最初の変数 因果的順序が最初の変数の同定 13 定理: 「 は その残差

    のどれとも独立 (𝑖は𝑗以外全部)」⟺ 「𝑥𝑗 は最初」 ( ) j j j i i j i x x x x x r ) var( ) cov( , − = j x 𝑥3 𝑥1 𝑥2 𝑥3 𝑥1 𝑥2
  10. DirectLiNGAMと背景知識 ◼因果的順序に関する背景知識の利用も可能 ◼離散変数も含む因果探索 (Park et al., 2018; Wei et al.,

    2018; Zeng et al., 2022) 14 最終特性 条件1 条件10 中間特性1 中間特性100 … 中間特性82 中間特性8 中間特性66 中間特性66 中間特性16 … … … … 因果探索 条件や最終特性に離散変数があってもよい 条件に当たる変数間に未観測共通原因あっても可 経時データ対応 条件部も探索可の場合あり
  11. 複数データセット (Ramsey et al. 2011, Shimizu, 2012) ◼複数の集団に対するモデル: • 共通の因果的順序:分布と係数は違ってもよい

    ◼類似性を利用して精度向上 • 「fMRI+脳」の模擬データで精度が大幅に向上 (Ramsey et al., 2011) ◼変数セットが同じでない複数データセット(Huang+2020) 16 ( ) c g e x b x g i i k j k g j g ij g i ,..., 1 ) ( ) ( ) ( ) ( ) ( ) ( = + =   𝑥3 𝑥1 𝑥2 4 -3 2 -0.5 5 集団1 集団2 𝑥3 𝑥1 𝑥2
  12. ソフトウェア ◼LiNGAM Python package (Ikeuchi+2023) ◼Causal-learn (Zheng+2024): dowhyやEconMLと同じレポジトリ ◼Causalas (SCREEN

    AS) • プログラミング書かずに クリックで 18 Github: https://github.com/cdt15/lingam Github: https://github.com/py-why/causal-learn
  13. 事例集 https://www.shimizulab.org/lingam/lingampapers/applications-and-tailor-made-methods 19 疫学 経済学 OpInc.gr(t) Empl.gr(t) Sales.gr(t) R&D.gr(t) Empl.gr(t+1)

    Sales.gr(t+1) R&D(.grt+1) OpInc.gr(t+1) Empl.gr(t+2) Sales.gr(t+2) R&D.gr(t+2) OpInc.gr(t+2) Moneta+(2012) Rosenstrom+(2012) 神経科学 化学 Campomanes+(2014) Ogawa+(2022) 予防医学 Kotoku+(2020) 金融 Jiang and Shimizu (2023) Sleep problems Depression mood Sleep problems Depression mood ? or
  14. 統計的信頼性評価 (Komatsu+2010) ◼有向道や有向辺のブートストラップ確率 ◼例えば、閾値0.05を越えるものを解釈 20 x3 x1 … … x3

    x1 x0 x3 x1 x2 x3 x1 99% 96% 総合効果: 20.9 10% https://lingam.readthedocs.io/en/latest/tutorial/bootstrap.html
  15. AIの説明性・公平性 ◼機械学習予測の因果に基づく反事実的説明指標(Galhotra+2021) • 必要性、十分性、及びその両方の確率に基づいて計算(Pearl, 1999) • 例: 𝑁𝑒𝑆𝑢𝑓(𝑋) = 𝑃

    𝑜′𝑋=𝑥’ , 𝑜𝑋=𝑥 ◼因果グラフをLiNGAMで推定 (Takahashi+2024): 既存研究資産のapplicability増 • 匿名化された14,018件の企業顧客の信用格付データで評価 • 背景知識: Credit ratingはsink ◼公平性(e.g., Kusner+17)へもおそらく同様 22
  16. 予測メカニズムの解析と制御応用へ (Blobaum+2017, Kiritoshi+2021) ◼説明変数X1の値を変えると機械学習モデルの予測 ෠ 𝑌はどう変わる? • X1を変えればX2, X3, X4も変わる:

    X1だけ違う値を入力してもダメ ◼制御応用 25 予測モデル 予測メカニズムのモデル 因果モデル 𝑥𝑖 = 𝑓𝑖 (𝑥𝑖 の親, 𝑒𝑖 ) ො 𝑦 = 𝑓 (𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 ) 𝑝(ො 𝑦|𝑑𝑜 𝑥𝑖 = 𝑐 ) 気筒数 排気量 重さ 馬力 加速度 燃費 燃費の予測値 燃費の予測 値の目標値 気筒数へ推奨 される介入 15 8 21 6 30 4 所望の値になるように 介入の設定値を逆算
  17. まとめ ◼因果探索は因果グラフを推測 ◼研究資産のApplicability増 • 因果効果や原因の確率の推定 • 因果推論と関連方法論の接続 ◼科学・実務の発展に貢献 27 特長

    統計的因果探索 土台 統計学・機械学習・統計的因果推論 ソフトウェア 科学応用 医学・農学・ 環境・金融・ 社会科学・ 生命科学・ 自動実験など 実務応用 製造・マーケ ティング・ EBPMなど AI 説明性・公平性 デジタルツイン LLM マルチモーダル その他関連方 法論 制御・力学系 可視化 量子コンピュー ティング 教育・リスキリング 博士(+社会人)・修士・学士 フィードバック