Upgrade to Pro — share decks privately, control downloads, hide ads and more …

統計的因果探索: セミパラメトリックアプローチを中心に

Shohei SHIMIZU
December 16, 2021

統計的因果探索: セミパラメトリックアプローチを中心に

電子情報通信学会 パターン認識・メディア理解(PRMU)研究会

Shohei SHIMIZU

December 16, 2021
Tweet

More Decks by Shohei SHIMIZU

Other Decks in Research

Transcript

  1. 統計的因果探索:
    セミパラメトリックアプローチを中心に
    清水昌平
    滋賀大学データサイエンス学系
    理化学研究所革新知能統合研究センター
    電子情報通信学会 パターン認識・メディア理解(PRMU)研究会

    View Slide

  2. 統計的因果探索とは
    • データを用いて因果グラフを推測するための方法論
    2
    Maeda and Shimizu (2020)
    仮定
    推測
    • 関数形
    • 分布
    • 未観測共通原因の有無
    • 非巡回 or 巡回 など
    データ 因果グラフ

    View Slide

  3. 因果探索の適用例:
    ターゲットの原因候補の探索
    https://www.shimizulab.org/lingam/lingampapers/applications-and-tailor-made-methods
    • 生命科学 (Maathuis et al., 2010)
    • 医学 (Kotoku et al., 2020)
    • 化学 (Campomanes et al., 2014)
    • 材料 (Nelson et al., 2021)
    • 気候学 (Liu et al., 2020)
    • 経済学 (Moneta et al., 2013)
    • 心理学 (von Eye et al., 2012)
    • 政策 (高山ら, 2021)
    • ネットワークデータ (Jarry et al., 2021)
    3
    Kotoku et al. (2020)
    Moneta et al. (2013)
    OpInc.gr(t)
    Empl.gr(t)
    Sales.gr(t)
    R&D.gr(t)
    Empl.gr(t+1)
    Sales.gr(t+1)
    R&D(.grt+1)
    OpInc.gr(t+1)
    Empl.gr(t+2)
    Sales.gr(t+2)
    R&D.gr(t+2)
    OpInc.gr(t+2)

    View Slide

  4. 統計的因果推論の出発点
    相関があるからと言って
    因果関係があるとは限らない

    View Slide

  5. 相関があるからと言って
    因果関係があるとは限らない
    5
    Messerli, (2012), New England Journal of Medicine
    !
    "
    #
    $




    (

    相関係数: 0.79
    P値 < 0.0001
    チョコレート消費量

    View Slide

  6. 相関関係と因果関係のギャップ
    6
    チョコ 賞
    ?
    チョコ 賞
    or
    GDP GDP
    チョコ 賞
    or
    GDP
    相関係数 0.79
    P値 < 0.0001
    複数の因果関係が
    同じ相関関係を与える

    未観測共通原因 未観測共通原因 未観測共通原因
    ギャップ
    チョコ

    View Slide

  7. ランダム化実験
    最も解析がシンプルになる方法
    • (患者)集団をランダムにふたつに分ける
    7

    治癒の
    割合
    治癒の
    割合
    なし
    などなどたくさん
    違いは、投薬の有無のみ
    ≠?
    Hernan (2004)の例を基に

    View Slide

  8. ランダム化実験しないとき
    • 重症な患者に投薬する傾向
    8

    治癒の
    割合
    治癒の
    割合
    なし
    などなどたくさん
    ≠?
    重症多め
    少なめ
    投薬の有無以外にも重症度が違う: 交絡がある

    View Slide

  9. 重症度の高低で分ける(層別)
    • 重症の人のみ集める (軽症の人のみ集める)
    9

    治癒の
    割合
    治癒の
    割合
    なし
    などなどたくさん
    ≠?
    みな重症
    違いは、投薬の有無のみ

    View Slide

  10. 重症度は共通原因
    • 重症かで投薬するかが決まり
    • 重症かで治癒するかも決まる
    • 相関関係と因果関係のギャップを生み出す
    • 共通原因で層別 (調整)
    – ランダム化実験をなんとか模擬したい
    10
    薬 治癒
    重症度
    共通原因

    View Slide

  11. ワクチンの効果推定のために
    共通原因で調整 (Dagan et al., 2020)
    • ワクチン接種とCovid-19の感染(or 重症化)の共通原因となりそうな変数で調整
    – 年齢、性別、セクター(一般ユダヤ人、アラブ人、超正統派ユダヤ人)
    – 居住地域
    – 過去5年間のインフルエンザワクチン接種歴
    – 妊娠
    – 重症化の危険因子として特定されている併存疾患の合計数
    11
    ワクチン接種 Covid-19
    共通原因
    年齢 性別 セクター
    居住地域
    インフル
    接種歴 妊娠 併存疾患

    View Slide

  12. どの変数で調整?
    • 構造的因果モデルで領域知識・仮定を表現 (Pearl, 2001)
    • 非巡回有向グラフであれば、 十分条件: 𝑥の親すべて, 𝑥の先祖すべて等
    – バックドア基準など
    12
    構造方程式 因果グラフ
    𝑦 = 𝑓!
    (𝑥, 𝑧, 𝑒!
    )
    𝑥 = 𝑓"(𝑧, 𝑒")
    x y
    z
    w
    u
    v
    q
    薬 ! 治癒 "
    重症度
    #
    共通原因
    !!
    !"

    View Slide

  13. 因果グラフが不明なことが多い
    • 事前知識が足りない
    • 仮説が十分ない
    • データから因果グラフを推測: 因果探索
    – 分析者の判断を補助
    13
    データ⾏列X
    観測


    推測
    x4
    x1
    x5
    x6
    x3
    x2
    +仮定

    View Slide

  14. 因果推論と機械学習との関わり
    14

    View Slide

  15. 効果の分解と公平性
    • 直接効果: 性別は女から男に変えるが、
    適性は変えないとき、
    雇用される確率はどのくらい変わるか?
    – これが大きいと、性差別がある
    • z (雇用)を機械学習の予測に置き換え
    • 「公平」な機械学習モデルの構築 (Kusner et al., 2017)
    – 因果モデルに基づき公平性を定義
    15
    x (性別) y (適性)
    z (雇用)
    (Pearl, 2001)
    公平にしたい変数Aの非子孫を説明変数にすればよい

    View Slide

  16. 原因の確率(Pearl, 1999; 黒木, 2014)
    と説明性
    • 必要性の確率
    – 現実には放射能を浴びて疾患を発症した対象者が
    放射能を浴びなかったならば疾患を発症しなかったであろう確率
    • 十分性の確率
    – 現実には放射能を浴びず疾患を発症しなかった対象者が
    放射能を浴びたならば疾患を発症したであろう確率
    • 必要十分性の確率
    – 「放射能を浴びなかったならば疾患を発症しなかったであろうし、
    放射能を浴びたならば疾患を発症したであろう」確率
    • 放射能が疾患の必要かつ十分な原因である程度
    • 高いほど、実際の原因(actual cause)と考える
    • 放射能: ある説明変数, 疾患: 予測結果へ置き換え (Galhotra et al., 2021)
    16
    16
    Galhotra et al. (2021)

    View Slide

  17. 機械学習のための因果推論でも要 (かなめ)
    • 公平性 (Kusner et al., 2017)
    • 説明性
    – 原因の確率 (Galhotra et al., 2021)
    – 予測メカニズム解析 (Blobaum et al., 2017; Sani et al., 2020)
    • 個体レベルの最適介入 (Kiritoshi et al., 2021)
    • 転移学習 (Zhang et al., 2013; Zhang et al., 2020; Bareinboim et al., 2016)
    • 科学的知識の取り込み (Teshima et al., 2021)
    • 上記のさまざまな因果に関するクエリーに答えられるかを判
    定するために因果グラフが必要
    17

    View Slide

  18. 統計的因果探索の方法
    18

    View Slide

  19. フレームワーク
    • 構造的因果モデル (Pearl, 2001)
    • 因果モデルに仮定をおき、
    その中でデータとつじつまの合うモデルを探す
    – 典型例1:
    • 非巡回有向グラフ
    • 未観測共通原因なし(すべて観測されている)
    – 典型例2:
    • 非巡回有向グラフ
    • 未観測共通原因あり
    19
    x3
    x1
    e3
    e1
    x2 e2
    𝑥!
    = 𝑓!
    (𝑥!
    の親, 𝑒!
    )
    誤差変数

    View Slide

  20. 関数形や分布には仮定をおかないアプローチ
    1. 因果グラフに仮定をおく
    – 非巡回有向グラフ
    – 未観測の!"#$なし(すべて観測されている)
    2. 仮定を満たす構造の中で、データと(最も)つじつまの合うグラフを選ぶ
    20
    x y x y x y
    「データでxとyが独立」なら、一番右の(c)を選ぶ
    (a)と(b)の区別はつかない(一意に決まらない): 同値類
    3つの候補
    (a) (b) (c)

    View Slide

  21. 拡張など
    • 潜在(未観測)共通原因を含めた同値類 (Spirtes et al., 1995)
    • 時間情報の利用 (Malinsky & Spirtes, 2018)
    • 巡回グラフを含めた同値類 (Richardson, 1996)
    21
    x y

    w z
    x y
    w z
    x y
    f1
    w z
    f2
    F. Eberhardt CRM Workshop 2016より
    (Malinsky and Spirtes, 2018)

    View Slide

  22. 関数形や分布にも仮定を入れてみる「と」
    • 条件付き独立性以外にも利用可能な情報がある
    • 例えば、線形性+非ガウス連続分布
    22
    x y
    観測変数x1,x2の
    分布が違う
    (条件付き独立性に違いはない)
    x y

    View Slide

  23. 具体的には、非ガウス性と独立性をどう使うか?
    23
    x1
    x2
    e1
    e2
    正しいモデル
    結果x2を原因x1に回帰 原因x1を結果x2に回帰
    2
    1
    21
    2
    1
    1
    1
    2
    2
    )
    1
    (
    2 )
    var(
    )
    ,
    cov(
    e
    x
    b
    x
    x
    x
    x
    x
    x
    r
    =
    -
    =
    -
    =
    は独立
    と )
    1
    (
    2
    1
    1
    )
    ( r
    e
    x =
    残差
    ( )
    )
    var(
    var
    )
    var(
    )
    ,
    cov(
    1
    )
    var(
    )
    ,
    cov(
    2
    1
    21
    1
    2
    2
    1
    21
    2
    2
    2
    1
    1
    )
    2
    (
    1
    x
    x
    b
    e
    x
    x
    x
    b
    x
    x
    x
    x
    x
    r
    -
    þ
    ý
    ü
    î
    í
    ì
    -
    =
    -
    =

    と )
    2
    (
    1
    2
    1
    21
    2
    )
    ( r
    e
    e
    b
    x +
    =
    2
    e
    従属
    ガウスだと
    無相関=独立
    𝑥!
    = 𝑒!
    𝑥"
    = 𝑏"!
    𝑥!
    + 𝑒" 𝑏!" ≠ 0

    View Slide

  24. DirectLiNGAMアルゴリズム (Shimizu et al., 2011)
    • 潜在共通原因なし (すべて観測されている)
    • 回帰分析と独立性の評価を繰り返す
    • Guaranteed to converge in finite steps (変数の数)
    • p>nの場合への拡張 (Wang & Drton, 2020)
    • 並列化+GPUで高速化 (Shahbazinia et al., 2021)
    • 数百から数千変数くらい
    24
    関連論文: https://www.shimizulab.org/lingam

    View Slide

  25. 推測された因果グラフを評価
    統計的信頼性評価
    • 有向道や有向辺のブートストラップ確率
    – 例えば、閾値0.05を越えるものを解釈
    – LiNGAM Python package
    モデル仮定の評価 (崩れの検出)
    • 誤差(残差)の独立性評価
    – 例えば、HSIC (Gretton et al., 2005)
    • マルコフ境界による予測の良さで評価
    (Biza et al., 2020)
    • 複数のデータセットでの結果を比較
    • 領域知識による評価
    25
    Wikipediaより
    x3
    x1
    … …
    総合効果:
    20.9
    x3
    x1
    x2
    x3
    x1
    46% 10%

    View Slide

  26. 他の識別可能なモデル
    • 非線形 + “加法” 誤差 (Hoyer et al., 2008; Zhang et al., 2009; Peters et al., 2014)
    • 𝑥# = 𝑓#(par(𝑥#)) + 𝑒#
    • 𝑥# = 𝑔#
    $"(𝑓#(par(𝑥#)) + 𝑒#)
    • 離散: ポワソンDAGモデルと拡張 (Park+18JMLR)
    • 離散と連続の混在: LiNGAM + ロジスティック型モデル (切片に条件必要)
    (Wei et al. 2018)
    • 時系列モデル (Hyvarinen et al, 2010)
    • 巡回モデル(Lacerda et al., 2008)
    は識別可能でない場合も
    26

    View Slide

  27. 非線形回帰して説明変数と残差が独立か調べる
    27
    x1
    x2
    e1
    e2
    正しいモデル
    結果𝑥#
    を原因𝑥$
    に非線形回帰 原因𝑥$
    を結果𝑥#
    に非線形回帰
    説明変数𝑥!
    (= 𝑒!
    )と残差は独立
    ガウスだと
    無相関=独立
    𝑥!
    = 𝑒!
    𝑥"
    = 𝑓(𝑥!
    ) + 𝑒" 𝑏!" ≠ 0
    説明変数𝑥"
    と残差は従属

    View Slide

  28. 潜在共通原因ありの場合
    • 潜在共通原因のあるペアがどれか
    (Maeda & Shimizu, 2020)
    • 潜在共通原因のあるペアの間を推測
    (Hoyer et al. 2008; Salehkaleybar et al., 2020)
    28
    𝑥# 𝑥$
    𝑓$
    𝑥%
    Original 出力
    𝑥&
    𝑥#
    𝑥$
    𝑥%
    𝑥&
    𝑓#
    𝑥# 𝑥$
    𝑓$
    𝑒$
    𝑒#
    𝑏!"
    𝜆!" 𝜆""
    𝑥# 𝑥$
    𝑓$
    𝑒$
    𝑒#
    𝑏"!
    𝜆!" 𝜆""
    or

    View Slide

  29. 潜在因子間の因果探索 (Shimizu et al., 2007)
    • Causal representationと呼ばれることも (Adams et al., 2021)
    • 因果グラフは不変な特徴という主張 (Schölkopf et al., 2021)
    • 目的関数 = 尤度+スパース正則化項 s.t. DAG制約
    29
    𝒇 = 𝐵𝒇+𝝐
    𝒙 = 𝐺𝒇+𝒆
    DAGである ⟺ ℎ 𝐵 = tr 𝑒'∘' −変数の数=0
    (Zheng et al., 2018)

    View Slide

  30. 他の話題: 変数をどうとるか
    • マクロ変数とミクロ変数
    – 国レベルと個人レベル
    – 結果は一致するのか
    • 領域知識の利用
    – (論文)テキストデータ等から抽出
    • より一般に、データによる支援は可能?
    – 介入によるアルゴリズム (Chalupka et al. 2017)
    30
    Messerli, (2012)
    Chalupka et al. (2017)

    View Slide

  31. まとめ
    31

    View Slide

  32. まとめ
    • 統計的因果推論: 因果クエリーに答えるための方法論
    – 仮定+データ+因果クエリー -> 回答 (ができれば)
    • 因果クエリーを式で表す
    • 因果クエリーに回答可能か判定 (識別性)
    • 実際に推定
    • 仮定の崩れの検出方法
    • 識別性を重視 (推定の技術は機械学習と共通)
    32
    仮定
    領域知識
    識別性 推定 評価
    データ
    実験・調査の
    計画に生かす
    変数・データの追加/仮定の変更
    分析者
    文献

    View Slide