応用空間統計ワークショップ@統数研(2025/1/8)

グラフ表現学習による空間データの介入効果推定京都大学大学院情報学研究科 / 理研AIP 竹内孝 2025年1月9日応用空間統計ワークショップ

竹内孝たけうちこう京都大学大学院情報学研究科知能情報学・データ科学コース講師【経歴】 2011-2020 日本電信電話株式会社
CS研研究員 2016-2019 京都大学博士後期課程博士(情報学) 2020-2023 京都大学助教 2023-現在現職（鹿島・竹内研究室）【専門分野】機械学習、データマイニング、時空間データ【その他・悩み】研究室の学生が増えすぎて座席が足りない渋滞長を予測信号制御交通管制センターカーナビ・地図アプリ経路誘導東京都の渋滞予測で一発屋（十年の計を遂に実現） 1

都市や地域で計測される情報を解析の実現 2 1. 時空間と意思決定の統合データ解析手法の体系化 2. 時空間基盤モデルの開発京都大学竹内チーム時空間基盤モデルの実現と社会実装
共同研究先の研究・開発機関（チーム構築）技術展開課題展開 A. 時空間と意思決定の情報を統一的に扱う方法論と技術の体系化 B. 体系化した技術に基づく時空間基盤モデルを社会で実運用 1. 都市や組織間でのデータ流通と利活用を促進 2. 多様な意思決定を補助し、社会の安心安全なAI運用に貢献 3. 共同研究先と協力した社会実装により、社会インパクトを発生 (他大学へ展開予定)

「AIを用いた空間・時系列データのモデリング手法と応用」を開催します • JSAI2025@大阪で空間データのWSを企画中 • https://sites.google.com/view/sig-stai/home • 今年で6回目と案外長くなってきました。 • 空間・時系列に関する発表なら、なんでもOK。既
発表もOK。聴講もぜひ。 • PDF（2～4ページ）をぶん投げてください • 発表申し込みは1/19まで！ • 雑談から始めましょう 3

Travel Demand Prediction with Application to Commuter Demand Estimation on
Urban Railways Yohei Kodama, Yuki Akeyama, Yusuke Miyazaki, and Koh Takeuchi. In Companion Proceedings of the ACM Web Conference 2024 (WWW '24). 4 元新幹線運転手のデータサイエンティストさんが主著！

商圏分析における新駅設置の影響予測どこに住んでる人はどの駅を使う？ • 駅の開設前のデータから、駅開設後の需要を予測したい • 需要を最大化する地点の選択、需要に合わせた駅の設計に活用 5 Yohei Kodama, Yuki
Akeyama, Yusuke Miyazaki, and Koh Takeuchi. 2024. Travel Demand Prediction with Application to Commuter Demand Estimation on Urban Railways. In Companion Proceedings of the ACM Web Conference 2024 (WWW '24). 開設前の郵便番号ごとの定期登録数最大駅の分布開設1年後の郵便番号ごとの定期登録数最大駅の分布

商圏分析における新駅設置の影響予測どこに住んでる人はどの駅を使う？ • 鉄道会社では距離に基づくボロノイ図が長年使用されている • しかし、現実の駅の選択のパターンとは乖離が生じる 6 郵便番号ごとの定期登録数最大駅の分布現実の選択と合わない
Yohei Kodama, Yuki Akeyama, Yusuke Miyazaki, and Koh Takeuchi. 2024. Travel Demand Prediction with Application to Commuter Demand Estimation on Urban Railways. In Companion Proceedings of the ACM Web Conference 2024 (WWW '24). 伝統的なモデル（ボロノイ図）駅の選択は地点と駅の距離に従うと仮定

郵便番号から鉄道駅を利用する人数を回帰する問題に帰着 • 郵便番号と駅の空間情報から利用者数を回帰する手法を提案 • JR西日本の4新駅のIC交通カードデータの実験から性能改善を確認 7 郵便番号と駅の空間情報から教師あり学習で予測 Yohei
Kodama, Yuki Akeyama, Yusuke Miyazaki, and Koh Takeuchi. 2024. Travel Demand Prediction with Application to Commuter Demand Estimation on Urban Railways. In Companion Proceedings of the ACM Web Conference 2024 (WWW '24).

QTNet: Theory-based Queue Length Prediction for Urban Traffic Ryu Shirakami,
Toshiya Kitahara, Koh Takeuchi, and Hisashi Kashima. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23). 8

渋滞フリーでスムーズな交通に向けた取り組み 11 ◦現代の渋滞対策 ① 交通状態をモニタリングする ② 渋滞の発生を確認する ③ 渋滞を解消するよう対処する信号の長さを調整する
→混雑している道路の流れを増やす空いている経路へ誘導する →混雑している道路の車を減らす ◦AIを用いた未来の渋滞対策 ① AIで交通ビッグデータを解析する ② AIで渋滞の発生を予測する ③ 渋滞を予防する信号の長さを先に調整する空いている経路へ先に誘導する渋滞予測AIの実用化を阻む問題・渋滞には多要因が絡むので高精度化が困難・AIの解釈性と信頼性が低いと実用化できないいつ・どこで何メートル？交通データを蓄積中交通管制センター Ryu Shirakami, Toshiya Kitahara, Koh Takeuchi, and Hisashi Kashima. 2023. QTNet: Theory-based Queue Length Prediction for Urban Traffic. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23).

深層学習と交通理論に基づく新たなアイディア 12 渋滞長、速度、交通量を統合解析する →時間的依存から渋滞兆候を早期発見する道路網の構造情報を入力する →交通の地理空間的な関係を反映する長さ解釈可能性時間場所
AIで交通データの時間・空間的に複雑なパターンを学習できるか？ ② 実用化に向けた解釈性担保 ① 渋滞予測の精度改善入力地理的に妥当な予測東京の道路網 →時空間グラフニューラルネットワーク（1STGNN）を活用し精度を改善する AIの渋滞長の予測は解釈しにくい交通の知識と大きく乖離することも (1) Spatio-Temporal Graph Neural Network (STGNN) (2) S. Takaba et al., Estimation and measurement of travel time by vehicle detectors and license plate readers. In Vehicle Navigation and Information Systems Conference, 1991, Vol. 2. 257–267. →交通理論とAIを融合し、渋滞予測の解釈性と精度を改善する交通工学の2数理モデルを活用する →交通工学の型に合わせることで、予測の頑健性を向上させる →解釈不可能な予測を除外する (渋滞長500mだが速度80km/hなど)

最先端の深層学習と交通理論を組み合わせた時空間AI技術（QTNN）による渋滞予測を提案 13 ①深層学習(STGNN)が交通/道路網データからパターンを学習し、現在までの交通データから今後の速度と交通量を予測 ② QT-layerが交通流モデルを活用・補正しつつ①の予測値から今後の渋滞長を予測
QTNNの模式図理論とデータのギャップを補正速度交通量渋滞長 STGNN 交通量速度補正項エンコーダデコーダ周期的/静的交通特徴量道路網構造 ① ② ・渋滞長の精緻な予測を実現・予測の解釈が可能に ①②組み合わせて・過去の計測値(青) ・未来の予測値(緑) 渋滞長 QT-Layer 交通理論ベースの処理層で、渋滞長は「砂時計モデル」から出力される Ryu Shirakami, Toshiya Kitahara, Koh Takeuchi, and Hisashi Kashima. 2023. QTNet: Theory-based Queue Length Prediction for Urban Traffic. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23). 警視庁交通管制センターから提供された東京の実際のデータで解析

東京都1098箇所の一般道における「1時間先の渋滞長を予測する実験」で、平均誤差40m以下を達成 14 東京都の構造改革の取り組み「シン・トセイ」において、警視庁による「AI とビッグデータを活用した交通管制システムの高度化プロジェクト」が進められています渋滞長m] 時刻渋滞長[m] 実際の観測値
予測値予測結果の解釈も可能交通量が急激に増加するため、大きな渋滞の発生する可能性がある予測誤差を40m以下に低減 ① QTNNは最先端のAIと比べて1時間先の誤差を12.6%改善しました 12.6% 最先端の深層学習技術：DCRNN, ARGCN, GWNT, MegaCRN ② 変数間の挙動に矛盾がないため、渋滞長を交通状況から説明可能 LLMと比較して軽量なモデルで GPU1枚で学習と推論が可能 Ryu Shirakami, Toshiya Kitahara, Koh Takeuchi, and Hisashi Kashima. 2023. QTNet: Theory-based Queue Length Prediction for Urban Traffic. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23).

実環境での本格的な運用に向けて、一部の道路において評価試験を実施し、信頼性の検証を進める予定 15 ◦本成果のITS（高度交通システム）における活用イメージを情報発信 ◦報道多数、外部評価も獲得報道17件：日経新聞、電気新聞、科学新聞、日刊自
動車新聞、客观日本、Science Japanなど子供の科学 2023年11月号イラストデザイン：津田祐果（UMA / design farm）、イラストレーター：米村知倫日経新聞 2023/12/27 朝刊外部評価：総務省 2023年度異能ジェネレーションアワード、科学技術振興機構 2024年度事業成果 (1) https://www.jst.go.jp/seika/bt2024-02.html 科学技術振興機構 2024年度 1)事業成果

グラフニューラルネットによる空間グラフデータ解析 16

空間の情報はグラフによって柔軟に表現できる • グラフはノード、エッジ、頂点特徴量で表現されるデータとする 17 道路網 = (交差点, 道路, 混雑度) https://www.mlit.go.jp/hakusyo/mlit/r01/hakusho/r02/html/n2611000.html
https://www.tokyometro.jp/library_in/en/subwaymap/pdf/rosen_en_1803.pdf https://www-nature-com.kyoto-u.idm.oclc.org/articles/s41586-019-1352-7 鉄道網 = (駅, 線路 , 利用客数) 線虫 = (神経細胞, シナプス, 発火数)

グラフニューラルネット (Graph Neural Networks: GNN) による空間データ解析 • GNNはグラフから特徴量を抽出する技術 • ノード分類、エッジ予測、グラフ毎の予測などに使用可能
18 空間グラフ = (座標, 距離, 座標特徴量) 𝐺 = 𝑉, 𝐸, 𝑿 𝑉 = 𝑁, 𝑿 ∈ 𝑅𝑁×𝑑 隣接行列 𝑨 ∈ 𝑅𝑁×𝑁 特徴量 𝑯 ∈ 𝑅𝑁×𝑑’ GNN 1 2 3 4 1 2 3 4 空間分布の傾向が抽出される

グラフニューラルネット(GNN)はグラフを解析するための強力なツール • GNNはグラフから特徴量を抽出する技術の1つ • 周辺の頂点の情報を集約することで空間的な傾向が見える 19 1 2 3
4 1 2 3 4 空間グラフ = (座標, 距離, 座標特徴量) 𝐺 = 𝑉, 𝐸, 𝑿 𝑉 = 𝑁, 𝑿 ∈ 𝑅𝑁×𝑑 隣接行列 𝑨 ∈ 𝑅𝑁×𝑁 特徴量 𝑯 ∈ 𝑅𝑁×𝑑’ GNN

グラフニューラルネットワークは、グラフ上で離れた頂点間の情報が伝搬し、特徴量を抽出する • GNN: 𝑯 = 𝑓 𝑊 (𝑿,𝑨)の演算は3ステップから構成 •
①頂点特徴量の変換、②メッセージの抽出、 ③メッセージの集約 • 上記の演算を繰返し、グラフ構造を反映した特徴量を抽出 20 1 2 3 4 1 2 3 4 1 2 3 4 ①頂点特徴量の変換 ③メッセージの集約 ②メッセージの抽出

時空間グラフニューラルネット (Spatio-temporal Graph Neural Networks: STGNN) • 頂点特徴量が時系列データである場合に特化したGNN • 空間的な特徴量をGNNで抽出
• 時間的な特徴量をCNNやRNNやTransformerで抽出 • 上記の操作を繰り返し、時空間的な特徴量を抽出 21 Weiwei Jiang, Jiayun Luo, “Graph neural network for traffic forecasting: A survey”, Expert Systems with Applications, Vol. 207, 空間的な特徴量 1 2 3 4 1 2 3 4 時間的な特徴量 1 2 3 4

ノード埋め込みの学習を取り入れたSTGNN Graph WaveNet • 事前に構築したグラフは、データの構造と適合しない場合がある • データからグラフの構造を学習してしまう → ノード埋め込み学習 22
Zonghan Wu et al. "Graph WaveNet for Deep Spatial-Temporal Graph Modeling,” In Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI), 2019. Lei Bai et al. “Adaptive Graph Convolutional Recurrent Network for Traffic Forecasting,” In Proceediongs of NeurIPS, 2020. 1 2 3 4 1 2 3 4 データに合うグラフを学習 GWNet

まだまだ空間データ解析 24

大規模な軌跡データから移動の特徴を抽出する技術 • 軌跡の形状やダイナミクスの情報を抽出し、GPSと時刻のみの情報から「渡り鳥はオスかメスか」などの分類高精度化に成功した 25 2つの軌跡の差異を抽出する渡り鳥※1,2の飛行軌跡データ鳥の性別など ※1 オオミズナギドリ
※2 発表者は計測現場を実際に確認するため新潟県粟島(離島)まで同行した赤：オスの移動軌跡青：メスの移動軌跡 Fréchetカーネル Koh Takeuchi, Masaaki Imaizumi, Shunsuke Kanda, Yasuo Tabei, Keisuke Fujii, Ken Yoda, Masakazu Ishihata, Takuya Maekawa. Fréchet Kernel for Trajectory Data Analysis, Proceedings of the 29th International Conference on Advances in Geographic Information Systems (SIGSPATIAL), pp. 221-22, 2021.

群衆移動誘導における介入効果推定 • 群衆の位置 X から避難誘導 Z による避難時間Yを予測する問題 • 空間特徴量をCNNで抽出し、介入効果推定する手法を提案 •
新国立劇場の避難シミュレータから生成したデータを用いた実験から介入効果推定の精度向上を確認 26 劇場からの避難誘導の有無とドアの開閉選択を介入とし2^7通りの組み合せの介入を想定新国立劇場大ホールのシミュレーション例 ①共変量から空間特徴量を抽出 ②ドメイン適応法により介入選択バイアスを除去 ③空間特徴量と介入から結果を予測 Spatial Convolutional Counter Factual Regression Koh Takeuchi, Ryo Nishida, Hisashi Kashima, Masaki Onishi. ” Grab the reins of crowds: Estimating the effects of crowd movement guidance using causal inference. ” Proceedings of the 20th International Conference on Autonomous Agents and MultiAgent Systems (AAMAS), 2021.

移動体へ逐次的に介入する場合での介入効果推定 • 周囲に存在する他の移動体や障害物との相互関係をモデリング • シミュレータから自動運転車の操舵、スポーツにおける指示などのデータを作成し介入効果推定の評価を行い性能改善を確認 27 Keisuke Fujii, Koh
Takeuchi, Atsushi Kuribayashi, Naoya Takeishi, Yoshinobu Kawahara, Kazuya Takeda. “Estimating counterfactual treatment outcomes over time in multi-vehicle simulation,” In Proceedings of the 30th International Conference on Advances in Geographic Information Systems (SIGSPATIAL), 2022.

Causal Effect Estimation on Hierarchical Spatial Graph Data Koh Takeuchi,
Ryo Nishida, Hisashi Kashima, and Masaki Onishi. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23). 28

なぜ道具を作るのか、何を知りたかったのか • 遠くを知るための望遠鏡 → 天文学の発展 • 近くを知るための顕微鏡 → 生物学の発展 •
？？を知るためのAI → ？？学の発展 29

観測、観察、解析、予測、意思決定のサイクル • 例えば、天文学は正確な暦を作ることで農業の発展に貢献してきた※ • 天体を観測し、移動の変化を観察し解析することで、未来を予測するモデルを立て農業を支援する技術（とも言える？） 30 ※Wikipediaで調べたレベルの知識です。プロのおとながいたら教えてください。航海術でも活用

データと理論の関係は難しいですね 31 • ティコの調査は当時最良の観測よりも5倍ほど正確 • 膨大な天体観測記録を残し、ケプラーの法則を産む基礎を構築。ティコ・プラーエ (Tycho
Brahe, 1546-1601) ガリレオ・ガリレイ (Galileo Galilei, 1564-1642) • 望遠鏡を用いた惑星の観察による地動説の証拠 • 物体の落下運動の法則、慣性の法則等の力学の基礎ヨハネス・ケプラー（Johannes Kepler、1571 - 1630）第5章運動を解明した人々: コペルニクス・ケプラー・ガリレイ https://www2.yukawa.kyotou.ac.jp/~takehiro.azuma/kagakugijutsu_azuma_slide.pdf • 惑星の運動に関するケプラーの3法則 • ティコ・ブラーエの観測データを元に惑星軌道の正確な決定を目指す。「初めて、正確な経験的事実を切なる情熱を持って追い求めるという、現代天文学にかなう精神を持った人」

現代社会における観測、予測、意思決定のサイクル • ネットに接続されたデバイスが都市や地域で稼働し、社会の情報がリアルタイムに計測される時代 • 社会の未来をデータ駆動に正確に予測できれば、安心安全なエビデンスに基づく意思決定※を支援できると期待される 32 ※EBPM（Evidence-based Policy
Making）や証拠に基づく政策立案とも言う制御工学分野のモデル予測制御 (MPC)などとも関係すると考えている

AI予測の不確実性に由来する社会実装後のワーストケースをどう防ぐか？ • 数理モデルやAIによる予測と予報が社会活動に大きな影響を与える • 例：南海トラフ地震臨時情報、台風の進路予測など • 予測には常に不確実性が伴う（確率モデルだから、それはそう） • 社会実装後はAI予測に基づく意思決定には大きな責任が伴う
33 南海トラフ地震臨時情報まもなく1か月課題踏まえどう対応？: 「あいまいな情報をもとにどう被害を減らすか、正解の無い答えを探している。国民全体が当事者となって一緒に解決策を考えるのが望ましい。」「これらのデータに基づいて南海トラフ地震を予知するには、克服すべき課題が多い。将来、予知できるよう、今の世代が観測データを蓄積する必要がある。」

社会を知るためのツールとして人工知能を活用する • 遠くを知るための望遠鏡→天文学の発展 • 近くを知るための顕微鏡→微生物学の発展 • 社会を知るための人工知能→情報学※の発展 34 ※おそらく、計量経済学、計量政治学、計量社会学などと接続する？

因果推論を用いた介入効果推定意思決定を介入として扱ってみる • 入力 (共変量)、介入、出力（結果）からなるデータセットを仮定 • 介入は条件付分布 π(入力) から得られると仮定 •
入力が与えられた時の介入の有無による差の期待値は？ 35

因果推論を用いた介入効果推定意思決定を介入として扱ってみる • 入力 (共変量)、介入、出力（結果）からなるデータセットを仮定 • 介入は条件付分布 π(入力) から得られると仮定 •
入力が与えられた時の介入の有無による差の期待値は？ 36 条件付き平均介入効果 (Conditional Average Treatment Effect: CATE) 介入した介入しない潜在的な出力 (Potential outcome) 平均介入効果 (Average Treatment Effect: ATE)

逆確率重み付け (IPW)は、あたかもRCTをしたかのようなデータを作る • ランダム比較化実験では介入が入力と独立なので、介入群と対照群のそれぞれの出力の期待値の差でATEが推定できる • 観察データでは介入が入力と非独立なので、IPWは推定した条件付分布 π(入力) で重みづけをして、あたかもRCTしたようなデータを作る。
37 出力の推定値 f(xi , ai )を用いて推定量を求める二重頑健推定 (AIPW)もある

機械学習をプラグインした介入効果推定 • 条件付分布 π(x i )や出力の推定値 f(x i , a
i )のモデルに機械学習(というか深層学習)を用いて高精度化する手法が多数提案（大雑把には） 38 Alicia Curth and Mihaela van der Schaar, Nonparametric Estimation of Heterogeneous Treatment Effects: From Theory to Learning Algorithms. In Proceedings of the 24th International Conference on Artificial Intelligence and Statistics (AISTATS), 2021

表現学習を用いた介入効果推定あたかもRCTをしたかのような特徴量を作る • ニューラルネットワークは、入力を表現する特徴量を学習する関数 • 合成関数で出力を予測するモデルを考える g(f(x i ), a
i ) • f(x i )があたかもRCTしたデータのようになればOK。 • f(x i )からaの見分けがつかないようにする→分布を正則化 39

Spatial Intervention Neural Network (SINet) 40

空間上の因果効果を推定する Spatial Intervention Neural Network (SINet) • 空間情報を扱うNNと因果推論を組み合わせ、空間上の介入の因果効果推定を推定するモデルを提案 •
データ駆動型モデルであるため、大量のデータからの学習が可能 • 深層学習による柔軟なモデリングが可能 41 空間GNN 因果推論空間介入 Neural Network Koh Takeuchi, Ryo Nishida, Hisashi Kashima, and Masaki Onishi. 2023. Causal Effect Estimation on Hierarchical Spatial Graph Data. In Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '23).

What-if分析をサポートする時空間因果推論の研究 • 意思決定による結果の変化を予測するモデルを開発した • 因果推論※1の介入(選択可能な変数)として意思決定を扱う仮定1. サンプル毎に意思決定が実行され、対応する結果のみが観測される(反事実欠損) 仮定2. 意思決定はポリシーに従い、過去の意思決定には偏りが存在する(介入選択バイアス) 42
※1 共変量Xの条件付き分布から介入Zが選択され、結果Yが観測される、因果推論におけるポテンシャルアウトカムのフレームワークに基づいている時空間因果推論モデル共変量 X どこにいる？介入 A どこで誘導？空間情報 G どんな場所？結果 Y 皆さんが避難するまで N分かかりました

技術課題と解決法 1. 共変量と介入の空間的影響の活用→階層的空間グラフの畳み込み 2. 反事実欠損と選択バイアスへの対処→HSICによる表現学習 3. 単調増加する時系列の予測→累積分布間の差異を評価する損失 43 ※1 共変量Xの条件付き分布から介入Zが選択され、結果Yが観測される、
因果推論におけるポテンシャルアウトカムのフレームワークに基づいている時空間因果推論モデル共変量 X どこにいる？介入 A どこで誘導？空間情報 G どんな場所？結果 Y 皆さんが避難するまで N分かかりました

空間的因果効果予測のための確率的生成モデル場所毎に潜在特徴量ZとローカルグラフAから共変量Xが観測グローバルグラフGと介入Cから結果Yが観測 44 [入力] 共変量 Xn ∈ 0,1 𝑀
𝑛 介入 Ck ∈ 0,1 𝐾 ローカルグラフ An グローバルグラフ G [出力] 時刻毎の結果 Yt (t=1, …, T ) Zn An Xn N G Ck K Yt T

階層的な空間グラフ畳み込みモデル • ローカルなGNNグラフから潜在特徴量Zを抽出 • グローバルなGNNから介入を考慮した潜在特徴量Z‘を抽出 • 単調増加する時系列データYを出力 45 Koh Takeuchi,
Ryo Nishida, Hisashi Kashima, Masaki Onishi. ” Causal Effect Estimation on Hierarchical Spatial Graph Data. ” In Proceedings of the 29th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD), 2023. Spatial Intervention Neural Networks (SINet)

1.共変量と介入の空間的影響の活用 • 介入を行うM個の座標と介入の有無を表現する座標特徴量Zを定める • 共変量と介入からなる空間グラフをGとする 𝐺 = 𝑉, 𝐸, 𝑋′
𝑉 = 𝑁 + 𝑀, 𝑋′ = 𝑋; 𝑍 , 𝑋 ∈ 𝑅𝑁×𝑑, 𝑍 ∈ 𝑅𝑀×𝑑 • N+Mが大きい場合、GNNでは共変量と介入の干渉が抽出困難 • 共変量と介入が遠く離れているため、多数回のグラフ畳み込みが必要 • GNNは畳み込みを繰り返すと特徴量が過平滑化され空間的な特徴が喪失 46

階層的な空間グラフデータ構造を利用した 2段階の特徴量抽出を提案 • 単一のグラフでは遠距離のホール間の関係がうまく抽出できない • グローバルとローカルな空間グラフで表現する 47 階層的空間グラフ介入と共変量の空間グラフ
劇場と誘導地点の様子共変量の空間グラフホールやフロア毎の様子辺は地点ごとの距離や移動時間などとする。 1 2 4 3 1 2 3 1 2 4 3 Global Local

2. 反事実欠損と選択バイアスへの対処 • 介入効果推定を行うためには以下が必要 [Sharit 16] • 反事実欠損の推定 • 介入の選択バイアスの除去バイアス
• 「共変量の潜在変数Zの分布」と「介入の埋め込みベクトルUの分布」が独立になるようHSICで正則化して表現学習 • PEHEの推定誤差の上限になるため、介入効果が推定可能 48 HSIC ＝Ε𝑍,𝑍′,𝑈,𝑈′ 𝑘 𝑍, 𝑍′ 𝑙 𝑈, 𝑈′ + Ε𝑍,𝑍′ 𝑘 𝑍, 𝑍′ Ε𝑈,𝑈′ 𝑙 𝑈, 𝑈′ - Ε𝑍,𝑈 [Ε𝑍′ [𝑘 𝑍, 𝑍′ ]Ε𝑈′ [𝑙(𝑈, 𝑈′)]]

3. 単調増加する時系列の予測：目的変数は時刻毎の避難完了者数 • 予測値は時刻毎に単調増加する分布とみなせる • 2つの累積分布関数F, F’の差異を評価する損失を新たに提案 49 The
Cramér-von Mises criteria The Kolmogorov–Smirnov criteria Smooth Max関数で一般化した損失関数を提案・α→∞のとき The Cramér-von Mises criteria ・α→0のとき The Kolmogorov–Smirnov criteria

実験 50

大規模な避難シミュレーションデータを用いた介入効果推定実験 • 新国立劇場における6個のフロア、9個の介入エリアからの避難シミュレーションから、時刻毎の避難完了者数の時系列データを作成 • 提案手法により介入効果を推定する問題での性能改善を確認 51 Koh Takeuchi,
Ryo Nishida, Hisashi Kashima, Masaki Onishi. ” Causal Effect Estimation on Hierarchical Spatial Graph Data. ” In Proceedings of the 29th ACM SIGKDD International Conference on Knowledge 新国立劇場のマップ時刻毎の避難完了者数の時系列データ

新国立劇場で避難訓練を行った研究チームの構築した避難シミュレータを使用してデータ生成 52 避難シミュレータの例山下倫央, 野田五十樹, 荻野光司,
高田和幸, 大原美保, 歩行者シミュレーションを用いた二段階避難による混雑軽減の分析, 人工知能学会論文誌, 2016, 31 巻, 6 号, p. AG-I_1-10, 2017 北九州芸術劇場で570人が参加した実働避難訓練でシミュレータのパラメータは調整済み。全員の避難時間の実測とシミュレーションの誤差は5％以下。経路誘導無しの場合経路誘導有りの場合

介入効果推定の性能評価を行う時空間データの作り方 • 介入効果推定の性能評価には、全ての介入選択に対応するデータ、あるいはランダムに介入が選択されたデータが必要 • 倫理・経済的な問題から条件を満たす時空間データは観測不可能 • シミュレータにより全介入に対応する結果を作成する手段を取った 53 ①現実の空間構造を使用するマルチエージェントシミ
ュレーションによりwhat-ifデータの生成 ②介入効果推定を行う機械学習モデルを構築時空間因果推論モデル ③未知データでの介入効果推定の予測精度を評価

介入効果推定の性能評価を行う時空間データの作り方 • 介入効果推定の性能評価には、全ての介入選択に対応するデータ、あるいはランダムに介入が選択されたデータが必要 • 倫理・経済的な問題から条件を満たす時空間データは観測不可能 • シミュレータにより全介入に対応する結果を作成する手段を取った 54 介入
Z 共変量 X ①乱数から大量に生成 ? 結果 Y ③シミュレータから生成 ②全組み合せを選択 ④意思決定のポリシーp(Z|X)を定め、訓練用の観察データDを作成する ⑤ D から時空間モデルfを学習し、テスト用の全介入に対応するデータの予測性能を評価いかに時空間的な関係を捉えつつ、ポリシー由来の介入選択バイアスを除去し、全ての反事実を予測するモデルを作れるか？

実験設定 • 新国立劇場の最大収容人数 3210 人までの避難を想定 • フロア毎の収容率を30%, 60%, 90% から選択し、エージェントを座席にラ
ンダムに配置し、全介入パターンでシミュレート • 方策から観察データを作成し訓練、未知のデータの全介入パターンに対する予測を評価 55 Model Train Data Test within Data Test without Data

定量評価：階層的な空間グラフデータからの介入効果推定 • 最新のSTGNN (DCRNN, ARGCN, GWNet)と比較して大幅な予測誤差の改善が確認された 56 Koh
Takeuchi, Ryo Nishida, Hisashi Kashima, Masaki Onishi. ” Causal Effect Estimation on Hierarchical Spatial Graph Data. ” In Proceedings of the 29th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD), 2023. 反事実への予測誤差介入効果の推定誤差教師あり学習 NN、 CFR STGNN

Ablation Study：各コンポーネントを削除した場合の性能比較 • 階層的な空間グラフ畳み込み(w/o Local, w/o T.N)の貢献が大きい • HSIC正則化による表現学習、および、累積分布に対する滑らかな損失関数
の貢献も確認 57

定量評価：時刻毎の推定誤差、避難者数毎の推定誤差の評価提案法はいずれの指標においても性能が安定して改善 58 Errors for all possible route guides
with different time stamps and # of evacuees

定性評価：テストデータの予測値と真値の比較同一の共変量に対し異なる介入を選択した場合の結果として、予測値を実線、真値を点線で示す。 SINetは既存手法よりも優れた予測性能を示すと定性的に確認。 59 誘導プラン A 誘導プラン B

雑談からコラボを始めましょう！気軽にご質問、ご連絡ください京都大学大学院情報学研究科 / 理研AIP 竹内孝 2025年1月9日応用空間統計ワークショップ

応用空間統計ワークショップ@統数研(2025/1/8)

応用空間統計ワークショップ@統数研(2025/1/8)

More Decks by Koh Takeuchi

Featured

Transcript