Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介: Multi-task DAG Learning for Multi-modal Data
Search
Naoki Chihara
May 29, 2025
Research
1
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
論文紹介: Multi-task DAG Learning for Multi-modal Data
研究室の勉強会に使用した資料
Naoki Chihara
May 29, 2025
More Decks by Naoki Chihara
See All by Naoki Chihara
Modeling Covariate Transition for Efficient Estimation of Longitudinal Treatment Effects in Randomized Experiments
naoki13
0
4
論文紹介: Dynamic Hyperparameter Optimization for Real-Time Data Streams
naoki13
0
1
Modeling Time-evolving Causality over Data Streams
naoki13
0
69
時間変化する因果関係の抽出に基づいた高速将来予測
naoki13
0
42
動的モード分解を活用した高速将来予測アルゴリズム
naoki13
0
25
論文紹介: A Robust Seasonal-Trend Decomposition Algorithm for Long Time Series
naoki13
0
2
周期解析による変動天体検出
naoki13
0
17
Other Decks in Research
See All in Research
業界横断 副業コンプライアンス調査 三者(副業者・本業先・発注者)におけるトラブル認知ギャップの構造分析
fkske
0
1.3k
Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定
nanoshimarobot
0
410
2026年3月1日(日)福島「除染土」の公共利用をかんがえる
atsukomasano2026
0
650
コーディングエージェントとABNを再考
hf149
2
730
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
1
270
[IR Reading 2026春 論文紹介] LLM-based Listwise Reranking under the Effect of Positional Bias (ECIR 2026) /IR-Reading-2026-Spring
koheishinden
PRO
0
130
重要だけど測れていないもの:高齢者ケアの見えない課題
theoriatec2024
0
370
LLM の Attention 機構まとめ — 数式・計算量・メモリ
puwaer
8
2.2k
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
620
R&Dチームを起ち上げる
shibuiwilliam
1
270
事後確率分布の共分散について
koide3
0
140
typst の使い方:言語学を研究する学生のために
gitomochang
0
460
Featured
See All Featured
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.9k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
200
How to train your dragon (web standard)
notwaldorf
97
6.7k
Become a Pro
speakerdeck
PRO
31
6k
Scaling GitHub
holman
464
140k
Navigating Team Friction
lara
192
16k
Making the Leap to Tech Lead
cromwellryan
135
9.9k
Are puppies a ranking factor?
jonoalderson
1
3.6k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
200
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
290
Mind Mapping
helmedeiros
PRO
1
260
Transcript
MM-DAG: Multi-task DAG Learning for Multi-modal Data - with Application
for Traffic Congestion Analysis 2025.05.29 ⼤阪⼤学 産業科学研究所 千原 直⼰
紹介する論⽂ 2025.05.29 © 2025 Naoki Chihara et al. 2 •
KDD 2023 に採択された論⽂
Summary 複雑なシステムから得られる multi-modal なデータから 因果関係を学習するための multi-task learning • スカラー /
ベクトル / 関数という複数種類のデータ間の線形な因果 関係を表現可能である • 重複していないノードが含まれていてもDAGの違いを評価可能な新 たなスコア関数を提供 • 提案⼿法を交通データに対して適⽤して、交通の意思決定に関する 価値ある知⾒を取得 2025.05.29 © 2025 Naoki Chihara et al. 3
Challenges in this work 本研究における課題は以下の3つ Ø Multi-modal • スカラー /
ベクトル / 関数 Ø Multi-task • 因果なら multi-context と呼称されている⽅が多いがする • 信号のある交差点 vs ない交差点 • 静的だが異なるデータの特性は異なる因果関係を持つという考え Ø Overlapping and Distinct variables • タスク毎にノードが統⼀されていない • 信号機の点滅周期 2025.05.29 © 2025 Naoki Chihara et al. 4
Challenges in this work 本研究における課題は以下の3つ Ø Multi-modal • スカラー /
ベクトル / 関数 Ø Multi-task • 因果なら multi-context と呼称されている⽅が多いがする • 信号のある交差点 vs ない交差点 • 静的だが異なるデータの特性は異なる因果関係を持つという考え Ø Overlapping and Distinct variables • タスク毎にノードが統⼀されていない • 信号機の点滅周期 2025.05.29 © 2025 Naoki Chihara et al. 5 例:1⽇の⾞の速度曲線 𝑣 𝑡 ※ 実際に得られるデータは有限次元 ※ 関数データとして扱いたいかどうか ※ 特徴:なめらか,稠密
本研究における課題は以下の3つ Ø Multi-modal • スカラー / ベクトル / 関数 Ø
Multi-task • 因果なら multi-context と呼称されている⽅が多いがする • 信号のある交差点 vs ない交差点 • 静的だが異なるデータの特性は異なる因果関係を持つという考え Ø Overlapping and Distinct variables • タスク毎にノードが統⼀されていない • 信号機の点滅周期 Challenges in this work 2025.05.29 © 2025 Naoki Chihara et al. 6
Challenges in this work 本研究における課題は以下の3つ Ø Multi-modal • スカラー /
ベクトル / 関数 Ø Multi-task • 因果なら multi-context と呼称されている⽅が多いがする • 信号のある交差点 vs ない交差点 • 静的だが異なるデータの特性は異なる因果関係を持つという考え Ø Overlapping and Distinct variables • タスク毎にノードが統⼀されていない • 信号機の点滅周期 2025.05.29 © 2025 Naoki Chihara et al. 7 Figure 1: Overview of MM-DAG
Challenges in this work 本研究における課題は以下の3つ Ø Multi-modal • スカラー /
ベクトル / 関数 Ø Multi-task • 因果なら multi-context と呼称されている⽅が多いがする • 信号のある交差点 vs ない交差点 • 静的だが異なるデータの特性は異なる因果関係を持つという考え Ø Overlapping and Distinct variables • タスク毎にノードが統⼀されていない • 信号機の点滅周期 2025.05.29 © 2025 Naoki Chihara et al. 8 Figure 1: Overview of MM-DAG
Notations • 𝐿:タスクの数 • 𝑃!:タスク 𝑙 に対応するノードの数 • 𝒱!:タスク 𝑙
に対応するノード集合 • 𝑥# $ ∈ ℝ%! " :タスク 𝑙 における 𝑗 番⽬のノードのデータ • 𝑇! " の次元に合わせてスカラー / ベクトル / 関数データが分かれる • 𝒢$ = 𝒱$ , ℰ$ :タスク 𝑙 に対応するグラフ 2025.05.29 © 2025 Naoki Chihara et al. 9
Multi-mode DAG with Known Structure 最初は Single-task learning の場合を考える 2025.05.29
© 2025 Naoki Chihara et al. 10 Q. どうやって表現する? A. 拡張ベイジアンネットワークと4種類の回帰式
Multi-mode DAG with Known Structure 最初は Single-task learning の場合を考える 𝑝
𝑥" , … , 𝑥# = + $%" # 𝑝 𝑥$ | 𝑝𝑎$ • Bayesian network で因果を表現している Ø 𝑝 𝑥# | 𝑝𝑎# を重回帰でモデリングする 𝑥$ = / $!∈'(" ℓ$!$ 𝑥$! + 𝑒$ • ℓ$!$ :線形変換 2025.05.29 © 2025 Naoki Chihara et al. 11 Markov条件の仮定
Multi-mode DAG with Known Structure 回帰式はデータの特性に沿って4種類必要 2025.05.29 © 2025 Naoki
Chihara et al. 12 • 通常の回帰でモデリング • ℓ!!! : 𝑇!" → 𝑇!
Multi-mode DAG with Known Structure 回帰式はデータの特性に沿って4種類必要 2025.05.29 © 2025 Naoki
Chihara et al. 13 • 係数の役割をする関数 𝛾!!!# 𝑠 : ℝ → ℝ を⽤いる • 無限の情報の圧縮 ⇨ 関数の内積の計算
Multi-mode DAG with Known Structure 回帰式はデータの特性に沿って4種類必要 2025.05.29 © 2025 Naoki
Chihara et al. 14 • 影響先が関数データ ⇨ 無限の影響を考えてやっとデータが構成される • 近傍への影響は類似するはず ⇨ 係数が関数
Multi-mode DAG with Known Structure 回帰式はデータの特性に沿って4種類必要 2025.05.29 © 2025 Naoki
Chihara et al. 15 • ⼊⼒の無限のデータを内積で圧縮したものを 無限に⽤意する ⇨ 係数が⼊⼒が2つの関数になる
© 2025 Naoki Chihara et al. Multi-mode DAG with Known
Structure 回帰式はデータの特性に沿って4種類必要 2025.05.29 基底の数 基底関数 Functional PCA • 関数データ 𝑥! 𝑡 を 𝐾! < ∞ 次元のベクトルで表現 Ø Case 1 の解き⽅と統⼀できる 16
© 2025 Naoki Chihara et al. Multi-mode DAG with Known
Structure 回帰式はデータの特性に沿って4種類必要 2025.05.29 17 これまでの話を統合する エッジの強さ (⾏列) 上記の式を線形の構造因果モデルとしてみなす = 𝐚(%) 𝐚(%) 𝐂 𝐶𝟐𝟏 𝐶𝟑𝟏 𝐶𝟑𝟐 𝑀 = 5, 𝑃 = 3
Multi-task Learning of Multi-mode DAG 1つのタスクが存在する状況における最適化 2025.05.29 © 2025 Naoki
Chihara et al. 18 重み⾏列 𝐖 , 最⼩⼆乗誤差 正則化 ⾮巡回制約
Multi-task Learning of Multi-mode DAG 複数のタスクが存在する状況における最適化 2025.05.29 © 2025 Naoki
Chihara et al. 19 , : Differentiable Causal Difference 最⼩⼆乗誤差 過度な構造の乖離の防⽌ 正則化 ⾮巡回制約
Design the Causal Difference 因果構造の差分を意味する微分可能な指標 DCD について Ø 既存の指標:Matrix distance
• 𝒢< または 𝒢= どちらか⼀⽅のものでしかないエッジの数 • ノード集合が同じもの同⼠のグラフの⽐較しかできない 2025.05.29 © 2025 Naoki Chihara et al. 20 😢
Design the Causal Difference 因果構造の差分を意味する微分可能な指標 DCD について 2025.05.29 © 2025
Naoki Chihara et al. 21 :値が⼩さいほど根ノードに近いことを⽰す • 因果順序 𝜋 によって親⼦関係が判断できない部分は 0.5 として考える • 疑似相関として妥当に⽣じてしまうエッジにペナルティを設けないようにした
Design the Causal Difference 因果構造の差分を意味する微分可能な指標 DCD について 2025.05.29 © 2025
Naoki Chihara et al. 22 新たな差分の定量化の定義 • 因果順序 𝜋 によって親⼦関係が判断できな い部分は 0.5 として考える • 疑似相関として妥当に⽣じてしまうエッジ にペナルティを設けないようにした
Design the Causal Difference 提案した差分 CD の Topological な解釈について 2025.05.29
© 2025 Naoki Chihara et al. 23 あるノード集合 𝒱 を持つグラフを想定して考え得る全ての 𝒯∗ で構成された集合 • エッジの組み合わせの1つを1つの点として捉えた空間を考える 定義した空間 𝒦𝒱 は Kolmogrov 空間であると⾔える
Design the Causal Difference 提案した差分 CD の Topological な解釈について 2025.05.29
© 2025 Naoki Chihara et al. 24 空間 𝒦𝒱 に対して距離‧射影を定義できる • 𝒦𝒱 が Kolmogrov 空間であるおかげ?(∵ Lemma 1)
Design the Causal Difference 提案した差分 CD の Topological な解釈について 2025.05.29
© 2025 Naoki Chihara et al. 25 定義2で得た CD が空間 𝒦𝒱%∩𝒱& 上における距離 であるということが証明された • 共通のノードで構成された新たな Kolmogrov 空間 𝒦𝒱%∩𝒱& に点 (DAG) を射影して、同⼀空 間上で扱える • 距離が⾃然に導⼊されている
Design the Causal Difference 提案した差分 CD の Topological な解釈について 2025.05.29
© 2025 Naoki Chihara et al. 26 微分できた⽅が嬉しいので、 シグモイド函数を使って 不連続部分を補完 元の距離の話を損っていない • ⼗分⼤きい c を⽤いるのが⼤事
Structural Learning Algorithm 拡張ラグランジュによる最適化 • NOTEARS で使われているものと全く同じ(なはず) 2025.05.29 © 2025
Naoki Chihara et al. 27 等式制約の書き換え
Experiments ベースライン • Separate: Single-task learning を タスクの数だけ⾏う • Order-consistency:
タスク間の因果 順序が等しいことを仮定 • 既存⼿法っぽい • MV-DAG: 関数データを平均値による 離散化によりベクトル化 • Matrix-Difference: 既存の Δ を使⽤ • MM-DAG: 提案⼿法 2025.05.29 © 2025 Naoki Chihara et al. 28
Experiments 渋滞の原因分析 Ø データセット 2025.05.29 © 2025 Naoki Chihara et
al. 29 ü 移動量が渋滞の⼤きな影響である ü 信号の周期は影響を与えない