統計的因果探索: セミパラメトリックアプローチを中心に

統計的因果探索: セミパラメトリックアプローチを中心に清水昌平滋賀大学データサイエンス学系理化学研究所革新知能統合研究センター電子情報通信学会パターン認識・メディア理解（PRMU）研究会

統計的因果探索とは • データを用いて因果グラフを推測するための方法論 2 Maeda and Shimizu (2020) 仮定推測
• 関数形 • 分布 • 未観測共通原因の有無 • 非巡回 or 巡回などデータ因果グラフ

因果探索の適用例: ターゲットの原因候補の探索 https://www.shimizulab.org/lingam/lingampapers/applications-and-tailor-made-methods • 生命科学 (Maathuis et al., 2010) •
医学 (Kotoku et al., 2020) • 化学 (Campomanes et al., 2014) • 材料 (Nelson et al., 2021) • 気候学 (Liu et al., 2020) • 経済学 (Moneta et al., 2013) • 心理学 (von Eye et al., 2012) • 政策 (高山ら, 2021) • ネットワークデータ (Jarry et al., 2021) 3 Kotoku et al. (2020) Moneta et al. (2013) OpInc.gr(t) Empl.gr(t) Sales.gr(t) R&D.gr(t) Empl.gr(t+1) Sales.gr(t+1) R&D(.grt+1) OpInc.gr(t+1) Empl.gr(t+2) Sales.gr(t+2) R&D.gr(t+2) OpInc.gr(t+2)

統計的因果推論の出発点相関があるからと言って因果関係があるとは限らない

相関があるからと言って因果関係があるとは限らない 5 Messerli, (2012), New England Journal of Medicine
! " # $ 賞受賞者 ( 数相関係数: 0.79 P値 < 0.0001 チョコレート消費量

相関関係と因果関係のギャップ 6 チョコ賞 ? チョコ賞 or GDP GDP
チョコ賞 or GDP 相関係数 0.79 P値 < 0.0001 複数の因果関係が同じ相関関係を与える賞未観測共通原因未観測共通原因未観測共通原因ギャップチョコ

ランダム化実験最も解析がシンプルになる方法 • (患者)集団をランダムにふたつに分ける 7 薬治癒の割合治癒の割合
なしなどなどたくさん違いは、投薬の有無のみ ≠? Hernan (2004)の例を基に

ランダム化実験しないとき • 重症な患者に投薬する傾向 8 薬治癒の割合治癒の割合なし
などなどたくさん ≠? 重症多め少なめ投薬の有無以外にも重症度が違う: 交絡がある

重症度の高低で分ける(層別) • 重症の人のみ集める (軽症の人のみ集める) 9 薬治癒の割合治癒の割合
なしなどなどたくさん ≠? みな重症違いは、投薬の有無のみ

重症度は共通原因 • 重症かで投薬するかが決まり • 重症かで治癒するかも決まる • 相関関係と因果関係のギャップを生み出す • 共通原因で層別 (調整)
– ランダム化実験をなんとか模擬したい 10 薬治癒重症度共通原因

ワクチンの効果推定のために共通原因で調整 (Dagan et al., 2020) • ワクチン接種とCovid-19の感染(or 重症化)の共通原因となりそうな変数で調整 –
年齢、性別、セクター（一般ユダヤ人、アラブ人、超正統派ユダヤ人） – 居住地域 – 過去5年間のインフルエンザワクチン接種歴 – 妊娠 – 重症化の危険因子として特定されている併存疾患の合計数 11 ワクチン接種 Covid-19 共通原因年齢性別セクター居住地域インフル接種歴妊娠併存疾患

どの変数で調整？ • 構造的因果モデルで領域知識・仮定を表現 (Pearl, 2001) • 非巡回有向グラフであれば、十分条件: 𝑥の親すべて, 𝑥の先祖すべて等
– バックドア基準など 12 構造方程式因果グラフ 𝑦 = 𝑓! (𝑥, 𝑧, 𝑒! ) 𝑥 = 𝑓"(𝑧, 𝑒") x y z w u v q 薬 ! 治癒 " 重症度 # 共通原因 !! !"

因果グラフが不明なことが多い • 事前知識が足りない • 仮説が十分ない • データから因果グラフを推測: 因果探索 – 分析者の判断を補助
13 データ⾏列X 観測変数推測 x4 x1 x5 x6 x3 x2 ＋仮定

因果推論と機械学習との関わり 14

効果の分解と公平性 • 直接効果: 性別は女から男に変えるが、適性は変えないとき、雇用される確率はどのくらい変わるか？ – これが大きいと、性差別がある • z
(雇用)を機械学習の予測に置き換え • 「公平」な機械学習モデルの構築 (Kusner et al., 2017) – 因果モデルに基づき公平性を定義 15 x (性別) y (適性) z (雇用) (Pearl, 2001) 公平にしたい変数Aの非子孫を説明変数にすればよい

原因の確率(Pearl, 1999; 黒木, 2014) と説明性 • 必要性の確率 – 現実には放射能を浴びて疾患を発症した対象者が放射能を浴びなかったならば疾患を発症しなかったであろう確率
• 十分性の確率 – 現実には放射能を浴びず疾患を発症しなかった対象者が放射能を浴びたならば疾患を発症したであろう確率 • 必要十分性の確率 – 「放射能を浴びなかったならば疾患を発症しなかったであろうし、放射能を浴びたならば疾患を発症したであろう」確率 • 放射能が疾患の必要かつ十分な原因である程度 • 高いほど、実際の原因(actual cause)と考える • 放射能: ある説明変数, 疾患: 予測結果へ置き換え (Galhotra et al., 2021) 16 16 Galhotra et al. (2021)

機械学習のための因果推論でも要 (かなめ) • 公平性 (Kusner et al., 2017) • 説明性
– 原因の確率 (Galhotra et al., 2021) – 予測メカニズム解析 (Blobaum et al., 2017; Sani et al., 2020) • 個体レベルの最適介入 (Kiritoshi et al., 2021) • 転移学習 (Zhang et al., 2013; Zhang et al., 2020; Bareinboim et al., 2016) • 科学的知識の取り込み (Teshima et al., 2021) • 上記のさまざまな因果に関するクエリーに答えられるかを判定するために因果グラフが必要 17

統計的因果探索の方法 18

フレームワーク • 構造的因果モデル (Pearl, 2001) • 因果モデルに仮定をおき、その中でデータとつじつまの合うモデルを探す – 典型例1:
• 非巡回有向グラフ • 未観測共通原因なし(すべて観測されている) – 典型例2: • 非巡回有向グラフ • 未観測共通原因あり 19 x3 x1 e3 e1 x2 e2 𝑥! = 𝑓! (𝑥! の親, 𝑒! ) 誤差変数

関数形や分布には仮定をおかないアプローチ 1. 因果グラフに仮定をおく – 非巡回有向グラフ – 未観測の!"#$なし(すべて観測されている) 2. 仮定を満たす構造の中で、データと(最も)つじつまの合うグラフを選ぶ 20
x y x y x y 「データでxとyが独立」なら、一番右の(c)を選ぶ (a)と(b)の区別はつかない(一意に決まらない): 同値類 3つの候補 (a) (b) (c)

拡張など • 潜在(未観測)共通原因を含めた同値類 (Spirtes et al., 1995) • 時間情報の利用 (Malinsky
& Spirtes, 2018) • 巡回グラフを含めた同値類 (Richardson, 1996) 21 x y ｆ w z x y w z x y ｆ1 w z ｆ2 F. Eberhardt CRM Workshop 2016より (Malinsky and Spirtes, 2018)

関数形や分布にも仮定を入れてみる「と」 • 条件付き独立性以外にも利用可能な情報がある • 例えば、線形性＋非ガウス連続分布 22 x y 観測変数x1,x2の分布が違う
(条件付き独立性に違いはない) x y

具体的には、非ガウス性と独立性をどう使うか？ 23 x1 x2 e1 e2 正しいモデル結果x2を原因x1に回帰原因x1を結果x2に回帰 2
1 21 2 1 1 1 2 2 ) 1 ( 2 ) var( ) , cov( e x b x x x x x x r = - = - = は独立と ) 1 ( 2 1 1 ) ( r e x = 残差 ( ) ) var( var ) var( ) , cov( 1 ) var( ) , cov( 2 1 21 1 2 2 1 21 2 2 2 1 1 ) 2 ( 1 x x b e x x x b x x x x x r - þ ý ü î í ì - = - = はと ) 2 ( 1 2 1 21 2 ) ( r e e b x + = 2 e 従属ガウスだと無相関＝独立 𝑥! = 𝑒! 𝑥" = 𝑏"! 𝑥! + 𝑒" 𝑏!" ≠ 0

DirectLiNGAMアルゴリズム (Shimizu et al., 2011) • 潜在共通原因なし (すべて観測されている) • 回帰分析と独立性の評価を繰り返す
• Guaranteed to converge in finite steps (変数の数) • p>nの場合への拡張 (Wang & Drton, 2020) • 並列化+GPUで高速化 (Shahbazinia et al., 2021) • 数百から数千変数くらい 24 関連論文: https://www.shimizulab.org/lingam

推測された因果グラフを評価統計的信頼性評価 • 有向道や有向辺のブートストラップ確率 – 例えば、閾値0.05を越えるものを解釈 – LiNGAM Python package
モデル仮定の評価 (崩れの検出) • 誤差(残差)の独立性評価 – 例えば、HSIC (Gretton et al., 2005) • マルコフ境界による予測の良さで評価 (Biza et al., 2020) • 複数のデータセットでの結果を比較 • 領域知識による評価 25 Wikipediaより x3 x1 … … 総合効果: 20.9 x3 x1 x2 x3 x1 46% 10%

他の識別可能なモデル • 非線形 + “加法” 誤差 (Hoyer et al., 2008;
Zhang et al., 2009; Peters et al., 2014) • 𝑥# = 𝑓#(par(𝑥#)) + 𝑒# • 𝑥# = 𝑔# $"(𝑓#(par(𝑥#)) + 𝑒#) • 離散: ポワソンDAGモデルと拡張 (Park+18JMLR) • 離散と連続の混在: LiNGAM + ロジスティック型モデル (切片に条件必要) (Wei et al. 2018) • 時系列モデル (Hyvarinen et al, 2010) • 巡回モデル(Lacerda et al., 2008) は識別可能でない場合も 26

非線形回帰して説明変数と残差が独立か調べる 27 x1 x2 e1 e2 正しいモデル結果𝑥# を原因𝑥$ に非線形回帰
原因𝑥$ を結果𝑥# に非線形回帰説明変数𝑥! (= 𝑒! )と残差は独立ガウスだと無相関＝独立 𝑥! = 𝑒! 𝑥" = 𝑓(𝑥! ) + 𝑒" 𝑏!" ≠ 0 説明変数𝑥" と残差は従属

潜在共通原因ありの場合 • 潜在共通原因のあるペアがどれか (Maeda & Shimizu, 2020) • 潜在共通原因のあるペアの間を推測 (Hoyer
et al. 2008; Salehkaleybar et al., 2020) 28 𝑥# 𝑥$ 𝑓$ 𝑥% Original 出力 𝑥& 𝑥# 𝑥$ 𝑥% 𝑥& 𝑓# 𝑥# 𝑥$ 𝑓$ 𝑒$ 𝑒# 𝑏!" 𝜆!" 𝜆"" 𝑥# 𝑥$ 𝑓$ 𝑒$ 𝑒# 𝑏"! 𝜆!" 𝜆"" or

潜在因子間の因果探索 (Shimizu et al., 2007) • Causal representationと呼ばれることも (Adams et
al., 2021) • 因果グラフは不変な特徴という主張 (Schölkopf et al., 2021) • 目的関数 = 尤度+スパース正則化項 s.t. DAG制約 29 𝒇 = 𝐵𝒇+𝝐 𝒙 = 𝐺𝒇+𝒆 DAGである ⟺ ℎ 𝐵 = tr 𝑒'∘' −変数の数=0 (Zheng et al., 2018)

他の話題: 変数をどうとるか • マクロ変数とミクロ変数 – 国レベルと個人レベル – 結果は一致するのか • 領域知識の利用
– (論文)テキストデータ等から抽出 • より一般に、データによる支援は可能？ – 介入によるアルゴリズム (Chalupka et al. 2017) 30 Messerli, (2012) Chalupka et al. (2017)

まとめ 31

まとめ • 統計的因果推論: 因果クエリーに答えるための方法論 – 仮定+データ+因果クエリー -> 回答 (ができれば) •
因果クエリーを式で表す • 因果クエリーに回答可能か判定 (識別性) • 実際に推定 • 仮定の崩れの検出方法 • 識別性を重視 (推定の技術は機械学習と共通) 32 仮定領域知識識別性推定評価データ実験・調査の計画に生かす変数・データの追加/仮定の変更分析者文献

統計的因果探索: セミパラメトリックアプローチを中心に

統計的因果探索: セミパラメトリックアプローチを中心に

Shohei SHIMIZU

More Decks by Shohei SHIMIZU

Other Decks in Research

Featured

Transcript