Upgrade to Pro — share decks privately, control downloads, hide ads and more …

統計的因果探索の方法

Shohei SHIMIZU
February 20, 2024

 統計的因果探索の方法

「因果とは何かー哲学・数学・物理から考える」 東北大学
https://www.tfc.tohoku.ac.jp/jp/design-lab/event/2000.html

Shohei SHIMIZU

February 20, 2024
Tweet

More Decks by Shohei SHIMIZU

Other Decks in Science

Transcript

  1. 統計的因果探索 • 統計的因果推論の七つ道具の一つ (Pearl, 2019) • データを用いて因果グラフを推測するための方法論 • 領域知識以外の手段 2

    Maeda and Shimizu (2020) 仮定(+領域知識) 推測 • 関数形 • 分布 • 未観測共通原因の有無 • 非巡回 or 巡回 など データ 因果グラフ
  2. 準備: データ生成過程のモデル • 分析対象の集団では、 変数の「値」が、どういう過程を経て生成されるか • 構造方程式 – 入力と出力の関係 –

    物理的な関係 (主観的でなく客観的) 4 𝑥 𝑦 𝑧 𝑥 = 𝑓# 𝑧, 𝑒# 𝑦 = 𝑓$ 𝑥, 𝑧, 𝑒$ 𝑒! 𝑒" 𝑒! と𝑒" は独立 パス図
  3. 関心: 介入したら、他の変数の分布はどうなる? • 介入後の集団を調べればよい – アイデア: 介入 = 構造方程式を取り替える –

    新しいデータ生成過程を持つ集団 • 介入後の分布を因果効果と呼ぶ – これを因果と呼ばなくても、介入後どうなるかを調べることには 意味があるだろう 5 介入後の分布 𝑥 𝑦 𝑧 𝑥 = 1 𝑦 = 𝑓$ 𝑥, 𝑧, 𝑒$ 1 𝑒! 𝑝(𝑦|𝑑𝑜 𝑥 = 1 ) 𝑝 𝑦 𝑑𝑜 𝑥 = 𝑐
  4. 構造的因果モデル(Pearl, 2009) • データ生成過程のモデル+介入による因果の定義 • 因果グラフが与えられると? – 介入後の分布(因果効果)が推定可能か判定可 – 推定可能なら、共変量調整などしてデータから実際に推定

    • 「介入したら」が「もしxxだったら(反実仮想)」に相当: 潜在反応モデル (Rubin 1974; Imbens & Rubin, 2015) 6 x3 x1 e3 e1 x2 e2 𝑥! = 𝑓! (𝑥! の親, 𝑒! ) 誤差変数 因果グラフ (パス図)
  5. 自律性の仮定 • 介入しても(構造方程式を取り替えても)、 他の構造方程式は変わらない 7 𝑥 𝑦 𝑧 𝑥 =

    𝑓# 𝑧, 𝑒# 𝑦 = 𝑓$ 𝑥, 𝑧, 𝑒$ 𝑒" 𝑒! 介入後の分布 𝑥 𝑦 𝑧 𝑥 = 1 𝑦 = 𝑓$ 𝑥, 𝑧, 𝑒$ 1 𝑒! 自然におまかせ 𝑝(𝑦|𝑑𝑜 𝑥 = 1 )
  6. 関数形や分布には仮定をおかないアプローチ 1. 因果グラフに仮定をおく – 非巡回有向グラフ – 未観測の共通原因なし 2. 仮定を満たす構造の中で、 データと(最も)つじつまの合うグラフを選ぶ

    10 𝑥 𝑦 𝑥 𝑦 𝑥 𝑦 「データでxとyが独立」なら、一番右の(c)を選ぶ (a)と(b)の区別がつかない(一意に決まらない): 同値類 3つの候補 (a) (b) (c)
  7. 忠実性 • 変数間の条件付き独立性の有無は、 グラフ構造のみによって決まる(ことにするための仮定) – 特定のパラメータの組合せの値は除く • ぴったりゼロになる“確率”は0だが、ゼロに近くても推定 は大変 (Zhang

    & Spirtes, 2003; Genin & Mayo-Wilson, 2024) – 近いところを除いて行って、大事なモデルは残ってる? • 緩める研究 (Ramsey, Spirtes & Zhang, 2006) 11 1 -1 1 ガウス分布だとすると、 パラメータの値によっては独立に 𝑦 = 𝑥 + 𝑧 + 𝑒$ 𝑧 = 𝑒/ cov(𝑥, 𝑧) = 0 𝑦 𝑥 𝑧 𝑥 = −𝑧 + 𝑒#
  8. 関数形や分布に仮定を入れてみる • 区別が可能な場合あり (識別可能性) – 線形性、非ガウス連続分布、非巡回性、未観測共通原因なし •LiNGAM: Linear Non-Gaussian Acyclic

    Model (Shimizu et al., 2006) • 誤差変数同士の独立性を利用 12 観測変数𝑥と𝑦の 分布が違う 𝑥 𝑦 𝑥 𝑦 (a) (b) 𝑦 = 𝑏𝑥 + 𝑒#
  9. 他の区別可能なモデル • 連続変数で非線形 (Hoyer et al., 2008; Zhang et al.,

    2009; Khemakhem et al., 2021) • 𝑥# = 𝑓#(par(𝑥#)) + 𝑒# • 𝑥# = 𝑔# $%(𝑓#(par(𝑥#)) + 𝑒#) • 離散変数 – ポワソンDAGモデルと拡張 (Park et al., 2018) – 順序尺度 (Ni et al., 2022) • 離散と連続の混在 – +ロジスティック型モデル (Wei et al. 2018; Zeng et al., 2022; Li et al., 2022) • 潜在共通原因あり (Hoyer et al., 2008; Tashiro et al.,2014, Maeda & Shimizu, 2021; Adams et al., 2021) • 忠実性は不要 or 最小性 (オッカムの剃刀)で済むこともある (Shimizu et al., 2011; Peters et al., 2014; Genin & Mayo-Wilson, 2024) 13
  10. 推定: 回帰して、残差と独立な方が原因 14 𝑥% 𝑥& 𝑒% 𝑒& 線形性+誤差変数の非ガウス性 結果𝑥0 を原因𝑥1

    に回帰 原因𝑥1 を結果𝑥0 に回帰 2 1 21 2 1 1 1 2 2 ) 1 ( 2 ) var( ) , cov( e x b x x x x x x r = - = - = は独立 と ) 1 ( 2 1 1 ) ( r e x = 残差 ( ) ) var( var ) var( ) , cov( 1 ) var( ) , cov( 2 1 21 1 2 2 1 21 2 2 2 1 1 ) 2 ( 1 x x b e x x x b x x x x x r - þ ý ü î í ì - = - = は と ) 2 ( 1 2 1 21 2 ) ( r e e b x + = 2 e 従属 ガウスだと 無相関=独立 𝑥/ = 𝑒/ 𝑥0 = 𝑏0/ 𝑥/ + 𝑒0 𝑏&% ≠ 0
  11. 注意: 独立な方が原因と「定義」している わけではない • 一方: グレンジャー因果やエントロピーに基づく方法など – 予測が上手くいく方/エントロピーが小さい方が原因と定義 – 潜在共通原因があるとダメという指摘

    – 例えば共変量を正しく入れたら 構造的因果モデルの因果グラフを推定していることがわかる等 • であれば、最初から構造的因果モデルなどのフレームワークで議 論し、グレンジャー因果などは特定の仮定の場合の推定法として 位置付けでよいのでは? 15
  12. まとめ • 「もしこれら仮定を受け入れるなら、データと組み合わせて、 これこれが示唆される」という流れ • 結果に違和感があれば、仮定(+領域知識)の選択に戻る わけだが、結果のみを見てしまいがち – もちろん統計的に信頼できなかったりおかしなモデルは捨てたい •統計的信頼性評価やモデル評価

    • 対抗馬: 相関+想像力 – 仮定の検討をきちんとした方が、良い意思決定につながると思うが • 「強弱色々の仮定で網羅的に探索し評価し、結果をまとめる」 までパッケージ化? 共通部分や整合性? 17