Slide 1

Slide 1 text

統計的因果探索の方法 清水昌平 滋賀大学データサイエンス学系 理研AIP 「因果とは何かー哲学・数学・物理から考える」 東北大学

Slide 2

Slide 2 text

統計的因果探索 • 統計的因果推論の七つ道具の一つ (Pearl, 2019) • データを用いて因果グラフを推測するための方法論 • 領域知識以外の手段 2 Maeda and Shimizu (2020) 仮定(+領域知識) 推測 • 関数形 • 分布 • 未観測共通原因の有無 • 非巡回 or 巡回 など データ 因果グラフ

Slide 3

Slide 3 text

統計的因果推論のフレームワーク 構造的因果モデル (Pearl, 2009) 3

Slide 4

Slide 4 text

準備: データ生成過程のモデル • 分析対象の集団では、 変数の「値」が、どういう過程を経て生成されるか • 構造方程式 – 入力と出力の関係 – 物理的な関係 (主観的でなく客観的) 4 𝑥 𝑦 𝑧 𝑥 = 𝑓# 𝑧, 𝑒# 𝑦 = 𝑓$ 𝑥, 𝑧, 𝑒$ 𝑒! 𝑒" 𝑒! と𝑒" は独立 パス図

Slide 5

Slide 5 text

関心: 介入したら、他の変数の分布はどうなる? • 介入後の集団を調べればよい – アイデア: 介入 = 構造方程式を取り替える – 新しいデータ生成過程を持つ集団 • 介入後の分布を因果効果と呼ぶ – これを因果と呼ばなくても、介入後どうなるかを調べることには 意味があるだろう 5 介入後の分布 𝑥 𝑦 𝑧 𝑥 = 1 𝑦 = 𝑓$ 𝑥, 𝑧, 𝑒$ 1 𝑒! 𝑝(𝑦|𝑑𝑜 𝑥 = 1 ) 𝑝 𝑦 𝑑𝑜 𝑥 = 𝑐

Slide 6

Slide 6 text

構造的因果モデル(Pearl, 2009) • データ生成過程のモデル+介入による因果の定義 • 因果グラフが与えられると? – 介入後の分布(因果効果)が推定可能か判定可 – 推定可能なら、共変量調整などしてデータから実際に推定 • 「介入したら」が「もしxxだったら(反実仮想)」に相当: 潜在反応モデル (Rubin 1974; Imbens & Rubin, 2015) 6 x3 x1 e3 e1 x2 e2 𝑥! = 𝑓! (𝑥! の親, 𝑒! ) 誤差変数 因果グラフ (パス図)

Slide 7

Slide 7 text

自律性の仮定 • 介入しても(構造方程式を取り替えても)、 他の構造方程式は変わらない 7 𝑥 𝑦 𝑧 𝑥 = 𝑓# 𝑧, 𝑒# 𝑦 = 𝑓$ 𝑥, 𝑧, 𝑒$ 𝑒" 𝑒! 介入後の分布 𝑥 𝑦 𝑧 𝑥 = 1 𝑦 = 𝑓$ 𝑥, 𝑧, 𝑒$ 1 𝑒! 自然におまかせ 𝑝(𝑦|𝑑𝑜 𝑥 = 1 )

Slide 8

Slide 8 text

巡回モデル • 平衡状態にあると仮定 • フィードバックを考えた方が自然?(“直後”?) • 全体というよりローカル? – 介入するので、外と内はあるし 8 𝑥 𝑦 𝑥 = 𝑎𝑦 + 𝑒# 𝑦 = 𝑏𝑥 + 𝑒$ 𝑒" 𝑒! 𝑥 𝑦 𝑥 = 𝑐 𝑦 = 𝑏𝑥 + 𝑒$ 𝑐 𝑒!

Slide 9

Slide 9 text

統計的因果探索 9

Slide 10

Slide 10 text

関数形や分布には仮定をおかないアプローチ 1. 因果グラフに仮定をおく – 非巡回有向グラフ – 未観測の共通原因なし 2. 仮定を満たす構造の中で、 データと(最も)つじつまの合うグラフを選ぶ 10 𝑥 𝑦 𝑥 𝑦 𝑥 𝑦 「データでxとyが独立」なら、一番右の(c)を選ぶ (a)と(b)の区別がつかない(一意に決まらない): 同値類 3つの候補 (a) (b) (c)

Slide 11

Slide 11 text

忠実性 • 変数間の条件付き独立性の有無は、 グラフ構造のみによって決まる(ことにするための仮定) – 特定のパラメータの組合せの値は除く • ぴったりゼロになる“確率”は0だが、ゼロに近くても推定 は大変 (Zhang & Spirtes, 2003; Genin & Mayo-Wilson, 2024) – 近いところを除いて行って、大事なモデルは残ってる? • 緩める研究 (Ramsey, Spirtes & Zhang, 2006) 11 1 -1 1 ガウス分布だとすると、 パラメータの値によっては独立に 𝑦 = 𝑥 + 𝑧 + 𝑒$ 𝑧 = 𝑒/ cov(𝑥, 𝑧) = 0 𝑦 𝑥 𝑧 𝑥 = −𝑧 + 𝑒#

Slide 12

Slide 12 text

関数形や分布に仮定を入れてみる • 区別が可能な場合あり (識別可能性) – 線形性、非ガウス連続分布、非巡回性、未観測共通原因なし •LiNGAM: Linear Non-Gaussian Acyclic Model (Shimizu et al., 2006) • 誤差変数同士の独立性を利用 12 観測変数𝑥と𝑦の 分布が違う 𝑥 𝑦 𝑥 𝑦 (a) (b) 𝑦 = 𝑏𝑥 + 𝑒#

Slide 13

Slide 13 text

他の区別可能なモデル • 連続変数で非線形 (Hoyer et al., 2008; Zhang et al., 2009; Khemakhem et al., 2021) • 𝑥# = 𝑓#(par(𝑥#)) + 𝑒# • 𝑥# = 𝑔# $%(𝑓#(par(𝑥#)) + 𝑒#) • 離散変数 – ポワソンDAGモデルと拡張 (Park et al., 2018) – 順序尺度 (Ni et al., 2022) • 離散と連続の混在 – +ロジスティック型モデル (Wei et al. 2018; Zeng et al., 2022; Li et al., 2022) • 潜在共通原因あり (Hoyer et al., 2008; Tashiro et al.,2014, Maeda & Shimizu, 2021; Adams et al., 2021) • 忠実性は不要 or 最小性 (オッカムの剃刀)で済むこともある (Shimizu et al., 2011; Peters et al., 2014; Genin & Mayo-Wilson, 2024) 13

Slide 14

Slide 14 text

推定: 回帰して、残差と独立な方が原因 14 𝑥% 𝑥& 𝑒% 𝑒& 線形性+誤差変数の非ガウス性 結果𝑥0 を原因𝑥1 に回帰 原因𝑥1 を結果𝑥0 に回帰 2 1 21 2 1 1 1 2 2 ) 1 ( 2 ) var( ) , cov( e x b x x x x x x r = - = - = は独立 と ) 1 ( 2 1 1 ) ( r e x = 残差 ( ) ) var( var ) var( ) , cov( 1 ) var( ) , cov( 2 1 21 1 2 2 1 21 2 2 2 1 1 ) 2 ( 1 x x b e x x x b x x x x x r - þ ý ü î í ì - = - = は と ) 2 ( 1 2 1 21 2 ) ( r e e b x + = 2 e 従属 ガウスだと 無相関=独立 𝑥/ = 𝑒/ 𝑥0 = 𝑏0/ 𝑥/ + 𝑒0 𝑏&% ≠ 0

Slide 15

Slide 15 text

注意: 独立な方が原因と「定義」している わけではない • 一方: グレンジャー因果やエントロピーに基づく方法など – 予測が上手くいく方/エントロピーが小さい方が原因と定義 – 潜在共通原因があるとダメという指摘 – 例えば共変量を正しく入れたら 構造的因果モデルの因果グラフを推定していることがわかる等 • であれば、最初から構造的因果モデルなどのフレームワークで議 論し、グレンジャー因果などは特定の仮定の場合の推定法として 位置付けでよいのでは? 15

Slide 16

Slide 16 text

まとめ 16

Slide 17

Slide 17 text

まとめ • 「もしこれら仮定を受け入れるなら、データと組み合わせて、 これこれが示唆される」という流れ • 結果に違和感があれば、仮定(+領域知識)の選択に戻る わけだが、結果のみを見てしまいがち – もちろん統計的に信頼できなかったりおかしなモデルは捨てたい •統計的信頼性評価やモデル評価 • 対抗馬: 相関+想像力 – 仮定の検討をきちんとした方が、良い意思決定につながると思うが • 「強弱色々の仮定で網羅的に探索し評価し、結果をまとめる」 までパッケージ化? 共通部分や整合性? 17