What is LiNGAM? - Speaker Deck

Slide 1

Slide 1 text

What is LiNGAM？長崎大学医学部６年中島誉也 1

Slide 2

Slide 2 text

参考資料 • 統計的因果探索 (機械学習プロフェッショナルシリーズ) |本 • 構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展 Qiita • LiNGAMモデルの識別可能性について • LiNGAMモデルの推定方法について • LiNGAM入門．気軽に因果関係を推定する(統計的因果探索) • ノイズがガウス分布だと因果的順序を特定できない理由 • 統計的因果探索のLiNGAMを実装してみた 2

Slide 3

Slide 3 text

Table of contents 1. LiNGAMとは 2. 因果探索とは 3. 線形な構造方程式モデルとは 4. 因果が循環しないとは(因果グラフについて) 5. 誤差項がNon Gaussianとは 6. LiNGAMモデルの推定 7. Take home message 3

Slide 4

Slide 4 text

Table of contents 1. LiNGAMとは 4

Slide 5

Slide 5 text

LiNGAM → Linear Non-Gaussian Acyclic Model • Linear : 線形な • Non-Gaussian : ガウス分布に従わない • Acyclic Model : 循環しないモデル？？？ 5

Slide 6

Slide 6 text

LiNGAMは因果探索の代表的手法 • 構造方程式モデルを前提において，因果探索を実施する • LiNGAMは，線形な(Linear)構造方程式を扱うモデルであり，その誤差変数は“ガウス分布に従うノイズ”ではなく(Non Gaussian)，さらに，因果関係が循環することのない(Acyclic)構造であるという前提のもとで因果探索を実施する． 6

Slide 7

Slide 7 text

線形な構造方程式モデル？因果探索？？誤差がNon Gaussian？因果が循環しない？？ 7

Slide 8

Slide 8 text

Table of contents 2. 因果探索とは 8

Slide 9

Slide 9 text

因果探索とは • 統計的因果推論の技術の１つ． • AとBの因果関係が未知の時に，観察データから因果に関する仮説を探索するための機械学習技術． • 統計的因果推論は，因果関係が既知の場合を対象にしている． 9

Slide 10

Slide 10 text

Q：因果探索における最大の困難は？ A：疑似相関を考える必要がある例) チョコレートの消費量が多い国は，ノーベル賞の受賞者が多い．（相関関係） Q: チョコレートをたくさん食べさせるほど，受賞者が増える？？（因果関係） A: 必ずしもそうとは言えない．相関関係と因果関係のギャップを疑似相関と呼ぶ． 10

Slide 11

Slide 11 text

因果探索の目的：データから因果関係を推測すること同じ相関を与えるような因果関係が複数存在する場合，相関係数の値だけ見ても正しい因果関係の推測はできない 11

Slide 12

Slide 12 text

Table of contents 3. 線形な構造方程式モデルとは 12

Slide 13

Slide 13 text

構造方程式モデルとはデータ生成過程のモデル．変数の「値」の決定関係を表す．例） X(原因)：薬を飲むかどうか（１：飲む，０：飲まない） Y(結果)：病気にかかっているかどうか（１：かかっている，０：かかっていない） ex：Xの値を決めることに寄与する変数すべて ey：Yの値を決定するために寄与しうるX以外のすべての変数をまとめて表す誤差変数観測変数（内生変数）未観測変数（外生変数） 𝒚 = 𝒇𝒚 (𝒙, 𝒆𝒚 ) 𝒙 = 𝒆𝒙 LiNGAMは𝒇に線形の仮定を与えている 13

Slide 14

Slide 14 text

Table of contents 4. 因果が循環しないとは(因果グラフについて) 14

Slide 15

Slide 15 text

因果探索でやりたいこと観察データから因果に関する仮説を探索すること観察データから因果グラフを推定すること 15 構造方程式モデルが表す変数の値の決定関係を因果グラフを用いて表現する

Slide 16

Slide 16 text

因果グラフをどう描くか 16 • 現状：分析者が領域知識を元に描く • 因果探索：データから描く • これから：領域知識とデータを両方使って因果グラフを描く

Slide 17

Slide 17 text

1. 構造方程式の右辺にある各変数が，左辺の変数の値を計算するために必要な時，左辺の変数へ有向辺を描く 2. モデル内の2つの変数の間に，未観測共通原因（潜在交絡変数）の存在が疑われる時に，その２つの変数に付随する誤差変数の間に両方向の有向円弧を描く 17 因果グラフの描き方のルール

Slide 18

Slide 18 text

ルール１構造方程式の左辺の値を計算するために必要かもしれない時 X（薬）Ｙ（病気） ex ey ルール２未観測共通原因が存在するかもしれない時 X（薬）Ｙ（病気） Z(重症度) 18 𝒚 = 𝒇𝒚 (𝒙, 𝒆𝒚 ) 𝒙 = 𝒆𝒙

Slide 19

Slide 19 text

• いつでもランダム化できるとは限らない（倫理面，コスト面） • 観察データ(＝ランダム化されていないデータ)に基づいて因果グラフを推定していく必要がある因果効果の推定には因果グラフに関する情報が必要 19

Slide 20

Slide 20 text

なぜ非巡回の仮定を置くのか？非巡回の仮定を置くことで，観測変数の生成順序(因果的順序) を決定することができるから!! 20

Slide 21

Slide 21 text

小まとめ：因果探索の基本問題データ行列Xを用いて，データXを生成したのが，モデル１なのかモデル２なのかを同定したい 21

Slide 22

Slide 22 text

𝒆𝟏, 𝒆𝟐 は，外生変数の確率分布に基づいて生成され，それぞれの値が，関数𝒇によって変換されて，内生変数x, yになる関数形と外生変数の分布は因果グラフの重要な構成要素 • どんな関数で決まるのか（𝒇𝒙 , 𝒇𝒚 が線形か非線形か） • 外生変数はどんな分布に従うのか小まとめ：因果探索の基本問題 22

Slide 23

Slide 23 text

統計的因果探索の主要な研究課題は，「関数形と外生変数の分布にどのような仮定が成り立てば，もとの因果グラフをどの程度推測できるのか」小まとめ：因果探索の基本問題 23

Slide 24

Slide 24 text

基本問題への３つのアプローチアプローチ関数の仮定外生変数の分布識別可能性ノンパラメトリック ✕ ✕ （非ガウス分布） △〜✕ パラメトリック ○ （線形性） ○ （ガウス分布） △〜✕ セミパラメトリック ○ （線形性） ✕ （非ガウス分布） ○ セミパラメトリックアプローチの代表モデルがLiNGAM 24 条件付き独立性を利用（因果的マルコフ条件）

Slide 25

Slide 25 text

非ガウス性を仮定するLiNGAMアプローチには因果探索の基本問題を解ける（＝識別可能性がある）という特徴がある非ガウス性の仮定がなぜ必要なんだ．．． 25

Slide 26

Slide 26 text

Table of contents 5. 誤差項がNon Gaussianとは 26

Slide 27

Slide 27 text

なぜ誤差項にNon Gaussianの仮定を置くのか誤差項をガウス分布と仮定すると因果的順序を特定できないから＝誤差項を⾮ガウス分布と仮定すると因果的順序を特定できる必要な知識 • 無相関と独立の違い • ダルモア・スキットビッチの定理 27

Slide 28

Slide 28 text

無相関と独立の関係性確率変数 X と Yが 1：独立なら無相関 2：無相関でも独立とは限らない 3：(多次元)ガウス分布に従うとき独立 ⟺ 無相関高校数学の美しい物語 28

Slide 29

Slide 29 text

無相関と独立の違い確率変数X,Yが無相関とは定義： E[XY]=E[X] E[Y] 性質１：共分散 Cov(X,Y) が 0 である性質２：相関係数が 0 である直感： X と Yの間に直線的な関係がない高校数学の美しい物語 29

Slide 30

Slide 30 text

確率変数X,Yが独⽴とは定義：任意のx, yに対して P(X=x,Y=y) = P(X=x)P(Y=y)が成立する（確率が二つの積に分解できる）直感： Xと Yの間には何の関係もない独立のほうが無相関より強い条件！！高校数学の美しい物語 30

Slide 31

Slide 31 text

3：(多次元)ガウス分布に従う時,独立 ⟺ 無相関の証明 31

Slide 32

Slide 32 text

無相関と独立の違いダルモア・スキットビッチの定理定理（ Darmois-Skitovic ） X1,⋯,XNを互いに独立な確率変数とし，Y1,Y2を以下のように定義する．このとき，もし Y1と Y2が独立ならば，すべての i で Xiはガウス分布にしたがう．対偶： Xiの分布が少なくとも１つでもガウス分布に従わなければ， Y1と Y2は独立にならない雑記：ダルモア・スキットビッチ定理の証明 32

Slide 33

Slide 33 text

なぜ誤差項にNon Gaussianの仮定を置くのかやりたいこと： 2つの観測変数の因果的順序を特定したい因果効果は線形で，非巡回であることを仮定外生変数の分散≠0，外生変数同士は独立とする独立性の仮定を置くことは，「潜在交絡変数がないこと」を意味するノイズがガウス分布だと因果的順序を特定できない理由 33

Slide 34

Slide 34 text

34 この矛盾を見つけることで因果的順序を決める

Slide 35

Slide 35 text

どうやって観測変数の因果的順序を特定するか「説明変数と残差が無相関になるまで搾り取る」のが線形回帰線形回帰説明変数が含むもの残差が含むもの正しい因果の向き説明変数の外生変数のみ被説明変数の外生変数のみ間違った因果の向きどちらも含むどちらも含むこのズレがあることを確認し，因果的順序を特定する 35

Slide 36

Slide 36 text

どうやって観測変数の因果的順序を特定するかまとめると… • 正しい因果の向きでは説明変数と残差が独立になる． • 間違った因果の向きでは説明変数と残差は独立にはならない．この違いを使って因果的順序を特定する！！しかし，(多次元)ガウス分布に従うとき独立 ⟺ 無相関であることから誤差変数がガウス分布だと因果的順序を特定できない．逆にガウス分布でなければ無相関にしても独立にはならないのでズレを捉えられる． 36

Slide 37

Slide 37 text

ガウス分布でなければ因果的順序が特定できる仕組み var(e1)，var(e2)≠0として，かつ b21≠0 を仮定つまり，x1が x2の原因になっている 37

Slide 38

Slide 38 text

Slide 39

Slide 39 text

39 対偶： Xiの分布が少なくとも１つでもガウス分布に従わなければ， Y1と Y2は独立にならない

Slide 40

Slide 40 text

LiNGAMの目的は，データ行列Xの情報のみを使って，パス係数行列Bを推定することパス係数行列Bを一意に推定可能＝パス係数行列Bを識別可能であるまとめ 𝒙𝒊 = ∑𝒌 𝒋 $𝒌(𝒊) 𝒃𝒊𝒋 𝒙𝒋 + 𝒆𝒊 OR 𝒙 = 𝑩𝒙 + 𝒆 𝒌(𝒊)： 𝒙𝒊 の生成順序外生変数𝒆𝒊 は分散≠0，非ガウス分布，互いに独立 40

Slide 41

Slide 41 text

Table of contents 6. LiNGAMモデルの推定 41

Slide 42

Slide 42 text

① 独立成分分析の手法を用いる(ICA-LiNGAM) ② 回帰分析と独立性の評価を繰り返す(Direct LiNGAM) 今回は①独立成分分析の手法(ICA-LiNGAM)を紹介 LiNGAMモデルの推定方法 42

Slide 43

Slide 43 text

独立成分分析(Independent component analysis)とは • 主成分分析をさらに発展させた方法． • 未観測変数の値が混ざり合って，観測変数の値が生成されると考える 43 観測変数ベクトルxのデータ生成過程： 𝒙𝒊 = ∑𝒋#𝟏 𝑷 𝒂𝒊𝒋 𝒔𝒋 OR 𝒙 = 𝑨𝒔 𝒔𝒋 は未観測変数(独立成分)で，分散≠0，非ガウス分布かつ独立， Aは正方行列で，混合行列と呼ぶ

Slide 44

Slide 44 text

独立成分分析(Independent component analysis)とは混合行列Aは列の順序と尺度を除いて識別可能混合行列Aは列の置換行列Pとスケーリング行列Dを除いて識別可能 𝑨𝒊𝒄𝒂 = 𝑨𝑷𝑫 44

Slide 45

Slide 45 text

列の順序や尺度を一意に推定できない理由 45 混合行列Aの列の順序や尺度を変えても，その変更に合わせて独立成分ベクトルsの順序や尺度を変えれば，変えた後の混合行列や独立成分ベクトルも独立成分分析モデルの仮定を満たすからよくわからん… 具体例が欲しい…

Slide 46

Slide 46 text

Slide 47

Slide 47 text

Slide 48

Slide 48 text

独立成分分析の手法 48 １．混合行列Aは正方行列であると仮定（観測変数の数と独立成分の数が同じと仮定）２．観測変数ベクトルxをp × pの行列Wで線形変換して作ったベクトル𝒚 = 𝑾𝒙を用いて独立成分ベクトルsを推定するこの行列Wを復元行列と呼ぶ最終目標：データから混合行列Aを推定する 𝒙 = 𝑨𝒔

Slide 49

Slide 49 text

独立成分分析の手法 49 復元行列が混合行列の逆行列と等しくなれば（𝑾 = 𝑨&𝟏），sが復元できる 𝒔 = 𝑾𝒙(= 𝑨&𝟏𝑨𝒔 = 𝒔) ３．Wを推定するために，ベクトルyの成分の独立性が最大になるようなWを探す ∵ベクトルｙで推定しようとしている独立成分ベクトルｓの成分は独立だから混合行列の逆行列となるような復元行列Wを推定する

Slide 50

Slide 50 text

独立性の評価指標 50 復元行列Wは行の順序を決める置換行列Pと行の尺度を決める対角行列Dを除いて識別可能 𝑾𝒊𝒄𝒂 = 𝑷𝑫𝑾 𝑷𝑫𝑨&𝟏

Slide 51

Slide 51 text

ICAモデルを用いたLiNGAMモデルの識別性 51 • LiNGAMモデルはICAモデルの特殊系 • LiNGAMモデル：観測変数𝒙𝒊 は，非ガウスかつ独立な外生変数𝑒% の線形結合から成る x1 x2 s1 s2 ICAモデル LiNGAMモデル x1 x2 e1 e2 𝒙 = 𝑨𝒔 𝒙 = 𝑩𝒙 + 𝒆

Slide 52

Slide 52 text

ICAモデルを用いたLiNGAMモデルの識別性 52 STEP1：行列を用いて線形結合を表す STEP2：復元行列Wを求める STEP3：置換行列Pを定める STEP4：スケーリング行列Dを定める STEP5：係数を表示する行列Bを求める最終目標：係数を表示する行列Bを求めたい

Slide 53

Slide 53 text

STEP1：行列を用いて線形結合を表す 53 観測変数𝒙𝒊 は，非ガウスかつ独立な外生変数𝒆𝒊 の線形結合から成る 𝒙 = 𝑩𝒙 + 𝒆 Bは係数行列でありp × pの正方行列因果グラフについて非巡回を仮定しているため, 観測変数の順序を正しい順序で並び替えると係数行列Bは対角成分がすべて0となる下三角行列(厳密な下三角行列)

Slide 54

Slide 54 text

STEP2：復元行列Wを求める 54 式変形すると, 𝒙 = (𝑰 − 𝑩)&𝟏𝒆 = 𝑨𝒆 ここで，誤差変数ベクトルeは独立で非ガウスであるからこの式はICAモデルとみなせる．行列Aの逆行列を復元行列Wとすると 𝑾 = 𝑨&𝟏 = 𝑰 − 𝑩 ICAによって求まる行列は本来のWから行の順序と尺度が異なる可能性のある行列となる．行の順序の置換行列Pと尺度を示す対角行列Dを用いて推定される復元行列𝑾𝒊𝒄𝒂 は 𝑾𝒊𝒄𝒂 = 𝑷𝑫𝑾 = 𝑷𝑫(𝑰 − 𝑩)

Slide 55

Slide 55 text

STEP3：置換行列Pを定める 55 式変形すると， 𝑷&𝟏𝑾𝒊𝒄𝒂 = 𝑫 𝑰 − 𝑩 ここで，非巡回性よりBの対角成分は０であるから 𝑰 − 𝑩 の対角成分は１さらに尺度関数Dの対角成分は０ではない．したがって，右辺の対角成分は０にならないから，左辺において， 𝑾𝒊𝒄𝒂 は対角成分に０が来ないように𝑷&𝟏に置換される必要がある．よって，そのような置換行列を4 5 𝑷とすると以下のように推定される

Slide 56

Slide 56 text

STEP4：スケーリング行列Dを定める 56 I−Bの対角成分は1なのでD(I−B)の対角成分は対角行列Dと同じ対角行列Dは/ 0 𝑷1 𝑾𝒊𝒄𝒂 の対角成分と等しいよってDの推定行列は以下のようになる / 0 𝑷1 𝑾𝒊𝒄𝒂 = 𝑫 𝑰 − 𝑩

Slide 57

Slide 57 text

STEP5：係数を表示する行列Bを求める 57 / 0 𝑷1 𝑾𝒊𝒄𝒂 = / 𝑫 𝑰 − 𝑩 = / 𝑫𝑾から，係数行列Bを推定行列は， 𝑰 − 𝑩 = 1 𝑾より，

Slide 58

Slide 58 text

Table of contents 7. Take home message 58

Slide 59

Slide 59 text

Take home message • 因果探索の目的は観察データから因果グラフを推測すること • 様々な仮定を置くことで，識別可能となる • 描けない場合のデータの支援が今後の鍵 • 未観測共通原因をどう扱っていくか • 医学研究への応用はほとんどされていない 59