Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2021年度日本計量生物学会年会チュートリアル「因果探索」の出だし

 2021年度日本計量生物学会年会チュートリアル「因果探索」の出だし

2021年度日本計量生物学会年会チュートリアル「因果探索」の出だし

638dd29baf6aa478d8eb0aeb0075c404?s=128

Shohei SHIMIZU

April 23, 2021
Tweet

Transcript

  1. 統計的因果探索の基礎 清水昌平 滋賀大学データサイエンス学系 理化学研究所革新知能統合研究センター 2021年度日本計量生物学会年会・チュートリアル 「因果探索」

  2. チュートリアル 「因果探索」 1. 清水: 統計的因果探索の基礎 70分 2. 前田: 未観測共通原因が存在するときの因果グラフ推定 40分

    3. 井元: LiNGAMモデルに基づく遺伝子制御ネットワーク推定 40分 2 -- 休憩10分 -- -- 休憩10分 -- 各パートで質疑の時間(約10分)を設けます
  3. 統計的因果探索の役割 3

  4. 統計的因果探索とは • データを用いて因果グラフを推測するための方法論 4 Maeda and Shimizu (2020) 仮定 推測

    • 関数形 • 分布 • 未観測共通原因の有無 • 非巡回 or 巡回 など データ 因果グラフ
  5. 統計的因果推論では因果グラフが要(かなめ) • データから介入効果を推定 – チョコ消費量を変えると ノーベル賞受賞者の数は どのくらい増えるのか(減るのか) • 介入効果を推定するために調整 –

    調整すべき変数の選択に 因果グラフが必要 (e.g., バックドア基準) 5 Messerli, (2012), New England Journal of Medicine チョコ 賞 GDP ! " # $ 賞 受 賞 者 ( 数 チョコレート消費量
  6. 因果グラフをどう描くか • 現状: 分析者が領域知識を基に描く • これから: 領域知識とデータを両方使って因果グラフを描く • 因果探索: データから描く

    6 チョコ 賞 GDP チョコ 賞 ? チョコ 賞 or GDP GDP チョコ 賞 or GDP
  7. 因果探索の適用例 https://sites.google.com/view/sshimizu06/lingam/lingampapers/applications-and-tailor-made-methods 7 疫学 経済学 Sleep problems Depression mood Sleep

    problems Depression mood ? or OpInc.gr(t) Empl.gr(t) Sales.gr(t) R&D.gr(t) Empl.gr(t+1) Sales.gr(t+1) R&D(.grt+1) OpInc.gr(t+1) Empl.gr(t+2) Sales.gr(t+2) R&D.gr(t+2) OpInc.gr(t+2) (Moneta et al., 2013) (Rosenstrom et al., 2012) 神経科学 化学 (Campomanes et al., 2014) (Boukrina & Graves, 2013)
  8. 因果グラフが描けると他にもいろいろできる • 「公平」な機械学習モデルの構築 (Kusner et al., 2017) 8 公平にしたい変数Aの非子孫を説明変数にすればよい 反事実的に公平:

    公平にしたい変数Aに介入しても予測結果が変わらない
  9. 機械学習モデルの予測メカニズムの解析 (Blobaum & Shimizu, 2017) • 介入して説明変数X1の値を変えると機械学習モデルの予測! 𝑌はどう変わる? – X1を変えればX2,

    X3, X4も変わる – X1だけ違う値を入力してもダメ • 原因の確率などによる機械学習モデルの説明性 (Galhotra et al., 2021) 9 𝑥! 𝑥" " 𝑌 𝑥# 𝑥$ 𝑥! 𝑥" 𝑥# 𝑥$ 𝑦 予測モデル % 𝑦 予測メカニズムのモデル 𝑥! 𝑥" 𝑥# 𝑥$ 因果モデル 𝑥! = 𝑓!(𝑥! の親, 𝑒!) ( 𝑦 = 𝑓 (𝑥", 𝑥#, 𝑥$, 𝑥%) 𝐸(( 𝑦|𝑑𝑜 𝑥! = 𝑐 )
  10. 因果探索は因果推論におけるチャレンジ • 古典的な方法は条件付き独立性を利用 (Pearl 2001; Spirtes 1993) – 関数形に仮定をおかない –

    同値類を見つけることが限界 • 限界を超えるには、追加の仮定が必要 – 関数形や分布に仮定 – よい塩梅は • LiNGAMは一例 (Shimizu et al., 2006; Shimizu, 2014) – 独立性を利用するための非ガウス連続分布の仮定 – (仮定が正しければ)一意に識別可能 10
  11. 続きは(オンライン)会場で! 11