Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データ駆動による因果仮説探索
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Shohei SHIMIZU
February 09, 2021
Science
2.1k
6
Share
データ駆動による因果仮説探索
JSTワークショップ「人工知能と科学」
Shohei SHIMIZU
February 09, 2021
More Decks by Shohei SHIMIZU
See All by Shohei SHIMIZU
因果推論と機械学習
sshimizu2006
1
1.1k
AIPシンポジウム 2025年度 成果報告会 「因果推論チーム」
sshimizu2006
3
450
Non-Gaussian, nonlinear causal discovery with hidden variables and application
sshimizu2006
0
100
因果AIへの招待
sshimizu2006
0
1.3k
先端因果推論特別研究チームの研究構想と 人間とAIが協働する自律因果探索の展望
sshimizu2006
3
870
統計的因果探索: 背景知識とデータにより因果仮説を探索する
sshimizu2006
4
1.3k
非ガウス性と非線形性に基づく統計的因果探索
sshimizu2006
0
1.8k
Causal discovery based on non-Gaussianity and nonlinearity
sshimizu2006
0
370
統計的因果探索の方法
sshimizu2006
1
1.6k
Other Decks in Science
See All in Science
俺たちは本当に分かり合えるのか? ~ PdMとスクラムチームの “ずれ” を科学する
bonotake
2
2.2k
Accelerating operator Sinkhorn iteration with overrelaxation
tasusu
0
280
baseballrによるMLBデータの抽出と階層ベイズモデルによる打率の推定 / TokyoR118
dropout009
2
890
HajimetenoLT vol.17
hashimoto_kei
1
210
People who frequently use ChatGPT for writing tasks are accurate and robust detectors of AI-generated text
rudorudo11
0
220
YouTubeにおける撤回論文の参照実態 / metascience-meetup2026
corgies
3
230
20260220 OpenIDファウンデーション・ジャパン ご紹介 / 20260220 OpenID Foundation Japan Intro
oidfj
0
310
見上公一.pdf
genomethica
0
120
データベース01: データベースを使わない世界
trycycle
PRO
1
1.2k
20251212_LT忘年会_データサイエンス枠_新川.pdf
shinpsan
0
270
Celebrate UTIG: Staff and Student Awards 2025
utig
0
1.3k
データベース02: データベースの概念
trycycle
PRO
2
1.1k
Featured
See All Featured
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
110
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
710
Making Projects Easy
brettharned
120
6.6k
Unsuck your backbone
ammeep
672
58k
Agile that works and the tools we love
rasmusluckow
331
21k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
sira's awesome portfolio website redesign presentation
elsirapls
0
210
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
180
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
130
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
110
Statistics for Hackers
jakevdp
799
230k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
Transcript
統計的因果推論と機械学習: データ駆動による因果仮説探索 清水昌平 滋賀大学データサイエンス学系 理化学研究所革新知能統合研究センター 2021.1.22 JSTワークショップ 「人工知能と科学」
統計的因果推論と機械学習 •統計的因果推論 – 介入するとどうなるか? • チョコ消費量を変えると ノーベル賞受賞者の数は変わるのか • どのくらい増えるのか(減るのか) •機械学習
– チョコ消費量がこのくらいだと 受賞者どのくらい? 2 Messerli, (2012), New England Journal of Medicine ! " # $ 賞 受 賞 者 ( 数 相関係数: 0.79 チョコレート消費量
相関関係と因果関係のギャップ 3 チョコ 賞 ? チョコ 賞 or GDP GDP
チョコ 賞 or GDP 複数の因果関係が同じ相関関係を与える 賞 未観測共通原因 未観測共通原因 未観測共通原因 ギャップ ҼՌάϥϑ チョコ
統計的因果推論の手順の例 1. 推定したいものを決める: 介入効果 2. 領域知識を用いて因果構造を表すグラフを描く (実験か観察か含む) 3. どの変数(共通原因)で調整すべきかを理論から導く 4.
(もしあれば) その変数を観測し調整に使い推定 4 チョコ 賞 GDP 𝐸 賞 𝑑𝑜 チョコ = 多い) = 𝐸調整に使う変数 [𝐸 賞 チョコ = 多い, 調整に使う変数)] 𝐸 賞 𝑑𝑜 チョコ = 多い) − 𝐸 賞 𝑑𝑜(チョコ = 少ない))
従来: 因果は扱いにくいもの • 「最近」起こった(広まった)こと – 理論面 (Rubin, Pearl) • 因果の数学的記述
• 領域知識と仮定を表現する道具の整備 • 因果推論のアルゴリズム化 – 適用面 • 機械学習の実用化・普及 – 機械学習では扱えないリサーチクエスチョンが何か明確に – 機械学習モデルの説明性、公平性 • Webサービス、行動経済学での因果推論の活用 – 因果推論によるビジネス、政策立案、適用領域の拡大 • 因果の科学: Causal Science (Pearl, 2020) 5
数学的フレームワーク (Imbens & Rubin, 2015; Pearl, 2001) • 構造的因果モデル (Pearl,
2001) • 因果の数学的表現 6 構造方程式 因果グラフ 構造方程式 因果グラフ 𝑥 = 𝑓) 𝑧, 𝑒) 𝑦 = 𝑓* 𝑥, 𝑧, 𝑒* 𝑥 = 1 𝑦 = 𝑓* 𝑥, 𝑧, 𝑒* 𝑝 𝑦 𝑑𝑜 𝑥 = 1 ≠ 𝑝 𝑦 𝑑𝑜 𝑥 = 0 であれば, 𝑥 causes 𝑦 𝑝 𝑦 𝑑𝑜 𝑥 = 1 𝑑𝑜 𝑥 = 1 𝑥: チョコ 𝑦: 賞 𝑧: GDP 𝑥: チョコ 𝑦: 賞 𝑧: GDP 1
推定可能性の理論 (Pearl, 2001; Spirets et al., 1993; Shimizu, 2014) •
因果グラフが描けたときに介入効果 – どの変数で調整すればよいか • 因果グラフ: 因果仮説探索 – データも使って描く: 例えば、線形性+非ガウス連続分布なら可 7 チョコ 賞 ? チョコ 賞 or GDP GDP チョコ 賞 or GDP x y z w u v q
8 データによる因果グラフ探索の適用例 https://sites.google.com/view/sshimizu06/lingam/lingampapers/applications-and-tailor-made-methods 疫学 経済学 Sleep problems Depression mood Sleep
problems Depression mood ? or OpInc.gr(t) Empl.gr(t) Sales.gr(t) R&D.gr(t) Empl.gr(t+1) Sales.gr(t+1) R&D(.grt+1) OpInc.gr(t+1) Empl.gr(t+2) Sales.gr(t+2) R&D.gr(t+2) OpInc.gr(t+2) (Moneta et al., 2012) (Rosenstrom et al., 2012) 神経科学 化学 (Campomanes et al., 2014) (Boukrina & Graves, 2013)
課題1: 未観測共通原因をどう懐柔するか • 現状: 領域知識により特定し観測する • どこまでデータにより支援できるか? – 例: 線形性と非ガウス連続分布
(Hoyer et al., 2008; Salehkaleybar et al., 2020) • 信号処理の理論: 独立成分分析 • 機械学習の理論: カーネル法 9 チョコ 賞 ? チョコ 賞 or GDP GDP チョコ 賞 or GDP 未観測共通原因 未観測共通原因 未観測共通原因 ҼՌάϥϑ
課題2: 変数をどうとるか • マクロ変数とミクロ変数 – 国レベルと個人レベル – 結果は一致するのか • 領域知識の利用
– (論文)テキストデータ等から抽出 • より一般に、データによる支援は可能? – 介入によるアルゴリズム (Chalupka et al. 2017) 10 Messerli, (2012) Chalupka et al. (2017)
まとめ: データ駆動による因果仮説探索 • 機械学習に加えて、統計的因果推論 – 因果グラフが領域知識で描ける場合は産業応用レベル – 描けない場合のデータによる支援が今後の鍵 • 課題
– 未観測共通原因 – 変数をどうとるか – データによる支援はどこまでできるか • 科学/工学の発展を加速 – 実験・調査、検証の効率化 11
12
因果グラフに関する領域知識の利用 • 領域情報+データから因果グラフを推測 – 製造業 • 製造条件 • その中間の特性 •
最終的な特性: 不良率など – 農業やマーケティングなどでも 13 最終特性 条件1 条件10 中間特性1 中間特性100 … 中間特性82 中間特性8 中間特性66 中間特性66 中間特性16 … … … … 因果探索