Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データ駆動による因果仮説探索
Search
Shohei SHIMIZU
February 09, 2021
Science
2.1k
6
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
データ駆動による因果仮説探索
JSTワークショップ「人工知能と科学」
Shohei SHIMIZU
February 09, 2021
More Decks by Shohei SHIMIZU
See All by Shohei SHIMIZU
因果推論と機械学習
sshimizu2006
1
1.2k
AIPシンポジウム 2025年度 成果報告会 「因果推論チーム」
sshimizu2006
3
520
Non-Gaussian, nonlinear causal discovery with hidden variables and application
sshimizu2006
0
130
因果AIへの招待
sshimizu2006
0
1.4k
先端因果推論特別研究チームの研究構想と 人間とAIが協働する自律因果探索の展望
sshimizu2006
3
920
統計的因果探索: 背景知識とデータにより因果仮説を探索する
sshimizu2006
4
1.3k
非ガウス性と非線形性に基づく統計的因果探索
sshimizu2006
0
2.1k
Causal discovery based on non-Gaussianity and nonlinearity
sshimizu2006
0
400
統計的因果探索の方法
sshimizu2006
1
1.7k
Other Decks in Science
See All in Science
Understanding CVP Waveforms: Interpretation and Clinical Implications in Anesthesiology
taka88
0
570
機械学習 - ニューラルネットワーク入門
trycycle
PRO
0
1k
力学系から見た現代的な機械学習
hanbao
4
4.2k
Cross-Media Technologies, Information Science and Human-Information Interaction
signer
PRO
3
32k
不動産業界における業界特化のデータ整備とAI活用 ─Vertical DataとVertical AI─
estie
1
350
SHINOMIYA Nariyoshi
genomethica
0
140
「遂行理論の未来」(松島斉教授最終講義記念セッションの発表資料)
shunyanoda
0
910
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
PRO
0
120
Tensor Factorization Meets Deformed Information Geometry: Convex Relaxation under Deformed Algebra
gkazunii
0
110
機械学習 - 授業概要
trycycle
PRO
0
510
データベース09: 実体関連モデル上の一貫性制約
trycycle
PRO
0
1.1k
水耕栽培:古代の知恵から宇宙農業まで
grow_design_lab
0
130
Featured
See All Featured
エンジニアに許された特別な時間の終わり
watany
107
250k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
200
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
160
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
Paper Plane
katiecoart
PRO
1
51k
Become a Pro
speakerdeck
PRO
31
6k
The untapped power of vector embeddings
frankvandijk
2
1.7k
Code Review Best Practice
trishagee
74
20k
Transcript
統計的因果推論と機械学習: データ駆動による因果仮説探索 清水昌平 滋賀大学データサイエンス学系 理化学研究所革新知能統合研究センター 2021.1.22 JSTワークショップ 「人工知能と科学」
統計的因果推論と機械学習 •統計的因果推論 – 介入するとどうなるか? • チョコ消費量を変えると ノーベル賞受賞者の数は変わるのか • どのくらい増えるのか(減るのか) •機械学習
– チョコ消費量がこのくらいだと 受賞者どのくらい? 2 Messerli, (2012), New England Journal of Medicine ! " # $ 賞 受 賞 者 ( 数 相関係数: 0.79 チョコレート消費量
相関関係と因果関係のギャップ 3 チョコ 賞 ? チョコ 賞 or GDP GDP
チョコ 賞 or GDP 複数の因果関係が同じ相関関係を与える 賞 未観測共通原因 未観測共通原因 未観測共通原因 ギャップ ҼՌάϥϑ チョコ
統計的因果推論の手順の例 1. 推定したいものを決める: 介入効果 2. 領域知識を用いて因果構造を表すグラフを描く (実験か観察か含む) 3. どの変数(共通原因)で調整すべきかを理論から導く 4.
(もしあれば) その変数を観測し調整に使い推定 4 チョコ 賞 GDP 𝐸 賞 𝑑𝑜 チョコ = 多い) = 𝐸調整に使う変数 [𝐸 賞 チョコ = 多い, 調整に使う変数)] 𝐸 賞 𝑑𝑜 チョコ = 多い) − 𝐸 賞 𝑑𝑜(チョコ = 少ない))
従来: 因果は扱いにくいもの • 「最近」起こった(広まった)こと – 理論面 (Rubin, Pearl) • 因果の数学的記述
• 領域知識と仮定を表現する道具の整備 • 因果推論のアルゴリズム化 – 適用面 • 機械学習の実用化・普及 – 機械学習では扱えないリサーチクエスチョンが何か明確に – 機械学習モデルの説明性、公平性 • Webサービス、行動経済学での因果推論の活用 – 因果推論によるビジネス、政策立案、適用領域の拡大 • 因果の科学: Causal Science (Pearl, 2020) 5
数学的フレームワーク (Imbens & Rubin, 2015; Pearl, 2001) • 構造的因果モデル (Pearl,
2001) • 因果の数学的表現 6 構造方程式 因果グラフ 構造方程式 因果グラフ 𝑥 = 𝑓) 𝑧, 𝑒) 𝑦 = 𝑓* 𝑥, 𝑧, 𝑒* 𝑥 = 1 𝑦 = 𝑓* 𝑥, 𝑧, 𝑒* 𝑝 𝑦 𝑑𝑜 𝑥 = 1 ≠ 𝑝 𝑦 𝑑𝑜 𝑥 = 0 であれば, 𝑥 causes 𝑦 𝑝 𝑦 𝑑𝑜 𝑥 = 1 𝑑𝑜 𝑥 = 1 𝑥: チョコ 𝑦: 賞 𝑧: GDP 𝑥: チョコ 𝑦: 賞 𝑧: GDP 1
推定可能性の理論 (Pearl, 2001; Spirets et al., 1993; Shimizu, 2014) •
因果グラフが描けたときに介入効果 – どの変数で調整すればよいか • 因果グラフ: 因果仮説探索 – データも使って描く: 例えば、線形性+非ガウス連続分布なら可 7 チョコ 賞 ? チョコ 賞 or GDP GDP チョコ 賞 or GDP x y z w u v q
8 データによる因果グラフ探索の適用例 https://sites.google.com/view/sshimizu06/lingam/lingampapers/applications-and-tailor-made-methods 疫学 経済学 Sleep problems Depression mood Sleep
problems Depression mood ? or OpInc.gr(t) Empl.gr(t) Sales.gr(t) R&D.gr(t) Empl.gr(t+1) Sales.gr(t+1) R&D(.grt+1) OpInc.gr(t+1) Empl.gr(t+2) Sales.gr(t+2) R&D.gr(t+2) OpInc.gr(t+2) (Moneta et al., 2012) (Rosenstrom et al., 2012) 神経科学 化学 (Campomanes et al., 2014) (Boukrina & Graves, 2013)
課題1: 未観測共通原因をどう懐柔するか • 現状: 領域知識により特定し観測する • どこまでデータにより支援できるか? – 例: 線形性と非ガウス連続分布
(Hoyer et al., 2008; Salehkaleybar et al., 2020) • 信号処理の理論: 独立成分分析 • 機械学習の理論: カーネル法 9 チョコ 賞 ? チョコ 賞 or GDP GDP チョコ 賞 or GDP 未観測共通原因 未観測共通原因 未観測共通原因 ҼՌάϥϑ
課題2: 変数をどうとるか • マクロ変数とミクロ変数 – 国レベルと個人レベル – 結果は一致するのか • 領域知識の利用
– (論文)テキストデータ等から抽出 • より一般に、データによる支援は可能? – 介入によるアルゴリズム (Chalupka et al. 2017) 10 Messerli, (2012) Chalupka et al. (2017)
まとめ: データ駆動による因果仮説探索 • 機械学習に加えて、統計的因果推論 – 因果グラフが領域知識で描ける場合は産業応用レベル – 描けない場合のデータによる支援が今後の鍵 • 課題
– 未観測共通原因 – 変数をどうとるか – データによる支援はどこまでできるか • 科学/工学の発展を加速 – 実験・調査、検証の効率化 11
12
因果グラフに関する領域知識の利用 • 領域情報+データから因果グラフを推測 – 製造業 • 製造条件 • その中間の特性 •
最終的な特性: 不良率など – 農業やマーケティングなどでも 13 最終特性 条件1 条件10 中間特性1 中間特性100 … 中間特性82 中間特性8 中間特性66 中間特性66 中間特性16 … … … … 因果探索