Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
世界モデルにおける分布外データ対応の方法論
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Hidehisa Arai
February 07, 2026
Research
7
1.9k
世界モデルにおける分布外データ対応の方法論
世界モデルも機械学習モデルである以上、分布外に対応できないという問題があります。この発表ではその課題に対してどのような対策が取られてきたかを紹介します。
Hidehisa Arai
February 07, 2026
Tweet
Share
More Decks by Hidehisa Arai
See All by Hidehisa Arai
生成AIの二大潮流と自動運転
koukyo1994
22
24k
ICML2021論文読み会資料
koukyo1994
2
1.6k
【2019-06-19】アルゴリズム勉強会 - 最小全域木
koukyo1994
0
290
Kaggle昔?話
koukyo1994
2
2.6k
コンペ中のコード、どうしてる?
koukyo1994
3
2.3k
変数間の関係を捉えたいあなたへ
koukyo1994
3
1.8k
脱! Deepでポン🎶ハイパラチューニング芸人を卒業するために
koukyo1994
7
4.8k
鳥蛙コンペ反省会資料
koukyo1994
3
1.5k
6th place solution to Cornell Birdcall Identification Challenge
koukyo1994
0
180
Other Decks in Research
See All in Research
Grounding Text Complexity Control in Defined Linguistic Difficulty [Keynote@*SEM2025]
yukiar
0
120
LiDARセキュリティ最前線(2025年)
kentaroy47
0
210
【NICOGRAPH2025】Photographic Conviviality: ボディペイント・ワークショップによる 同時的かつ共生的な写真体験
toremolo72
0
190
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
150
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning
satai
3
580
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
260
SREのためのテレメトリー技術の探究 / Telemetry for SRE
yuukit
13
3.2k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
140
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
16
22k
学習型データ構造:機械学習を内包する新しいデータ構造の設計と解析
matsui_528
6
3.7k
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
520
生成AI による論文執筆サポート・ワークショップ 論文執筆・推敲編 / Generative AI-Assisted Paper Writing Support Workshop: Drafting and Revision Edition
ks91
PRO
0
140
Featured
See All Featured
How to Talk to Developers About Accessibility
jct
2
140
Abbi's Birthday
coloredviolet
2
5.1k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
63
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
190
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
68
WENDY [Excerpt]
tessaabrams
9
36k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
300
Designing for Performance
lara
611
70k
sira's awesome portfolio website redesign presentation
elsirapls
0
170
Transcript
世界モデルにおける分布外データ対応 の⽅法論 2026年2⽉8⽇ 第66回 コンピュータビジョン勉強会@関東 Turing株式会社 荒居秀尚 1
世界モデル? https://x.com/wzihanw/status/2002092055884124297?s=20 「世界モデル」という⾔葉で指すものには揺れがある 2
この発表における世界モデルの定義 ICLR 2025のTim Rocktäschel (DeepMind)によるKeyNoteの定義に従います https://iclr.cc/virtual/2025/invited-talk/36780 3
とすると‧‧‧? Data Augmentationを action、画像そのものをstate として認めれば世界モデル(苦 しい) nullをactionとして 認めれば世界モデル 世界そのもの 疑問の余地なく
世界モデル ルールベースでも 世界モデルには 変わりない(※) stateは静的、actionは視点の 移動だとすれば世界モデル patchをstate、どこを隠すか の選択をactionとすれば世界 モデル ※今回の発表は、データから学習されるものについて の話のため、このパターンは除外します 4
⾃⼰紹介 荒居 秀尚 / Hidehisa Arai Turing株式会社 ↓Kaggle 2x Grandmaster
⾃動運転システム開発における合成データの活⽤に興味があります https://turingmotors.github.io/actbench/ ↓2024/04~ 2025/02 ↓2025/02~ 5
世界モデルにみられる⾯⽩現象 ⾃⾞に対する指⽰が、他のエージェントの動きにも影響を及ぼす現象を確認 他にも⾃⾞に対する加速指⽰により前⾛⾞も加速する‧⾚信号で発進すると⻘になる、等がある 6
なぜこの現象は起こる?(仮説) Causal Misalignmentと命名して論⽂化 https://arxiv.org/abs/2412.05337 7
この現象をより⼀般化する Stateが学習分布外(OOD)な例:⾃動運転の世界モデルに室内の映像を⽣成させる ActionがOODな例:ロボットの世界モデルに2回宙返りの映像を⽣成させる State × ActionがOODな例 (Joint OOD):今回のケース(Causal Misalignment) 予測分布からの採取時にOODになる例(Rollout
OOD):⾃⼰回帰動画⽣成でEncode →Decodeを繰り返すと劣化していく →普通にデータを集めても得られないケースについて世界モデルに⽣成させるには? 8
対策①:Iterative Update 9
世界モデルもPolicyも更新しまくろう! モデリング対象の世界を探索することでOODデータを集める 10
Iterative Updateアプローチの推進者たち 世界モデルの初期の研究はこの⽅向性だった https://worldmodels.github.io/ David Ha and Jürgen Schmidhuber. “World
Models” Hafner et al. “Dream to Control: Learning Behaviors by Latent Imagination.” 11
Iterative Updateの破綻 現実世界では危険すぎたり、コストが⾼すぎたりして実践しづらい 12
対策②:Foundation World Model 13
https://iclr.cc/virtual/2025/invited-talk/36780 14
https://iclr.cc/virtual/2025/invited-talk/36780 15
Foundation Modelアプローチ Scaling Lawに乗っかり、データ‧モデル‧計算量を⾼める王道のアプローチ 16
Foundation Modelアプローチの推進者たち GoogleやNVIDIAなどビッグテックが中⼼となっている Genieシリーズ (Google DeepMind) NVIDIA Cosmos https://deepmind.google/models/genie/ https://www.nvidia.com/ja-jp/ai/cosmos/
17
Foundation Modelで解決か? 系統的に集まりづらいデータや、諸制約により取ることができないデータはある 社会規範から逸脱する⾏動が必要なものや、特殊なセンサを要するもの、取得コストが⾼すぎるものなど 18
対策③:Simulation Data 19
シミュレータ‧ゲームの活⽤ 現実をよく模倣したシミュレータ‧ゲームのデータも混ぜて世界モデルを学習 20
シミュレーションデータ活⽤は有効か? シミュレータで収集したデータを使うことは有効という研究結果がある Yang et al. “ReSim: Reliable World Simulation for
Autonomous Driving.” NeurIPS 2025 Spotlight. 21
ReSim CogVideoXベースのDiTを3種のデータソースで追加学習 Yang et al. “ReSim: Reliable World Simulation for
Autonomous Driving.” NeurIPS 2025 Spotlight. 22 OpenDV 実動画のみ NAVSIM 実動画+expertアクション CARLA Sim動画+non-expertアクション
ReSim Simデータの追加により、分布外の⽣成もできるようになるという結果 Yang et al. “ReSim: Reliable World Simulation for
Autonomous Driving.” NeurIPS 2025 Spotlight. 23 Simデータを学習に使うことで、⽣成の視覚的 品質も、指⽰軌跡に従う度合いも強くなること がわかった Simデータの追加により、より現実 的な⽣成ができるようになっている
⼤量のゲームで学習されたGenie 3の実⼒ Genie 3を使って作られたWaymoの世界モデルは極めてレアな事象を⽣成できる https://waymo.com/blog/2026/02/the-waymo-world-mod el-a-new-frontier-for-autonomous-driving-simulation 24
世界モデルのOOD問題はこれで解決なのか? 正確なマルチエージェントシミュレーションは極めて困難 ↑Genie3でも “Limitations”の⼀つに他のエージェントの シミュレーションが難しいことが挙げられている CARLAシミュレータのシミュレーションの様⼦ 25
Take Home Message • 世界モデルといえども機械学習モデル。分布外の状況に弱いという問題は普 通にある。 • 分布外対応は様々な⽅策が考えられてきたが、近年は⼤量の実データ+シミュ レーションデータという組み合わせが有効であることがわかっている。 •
しかし、シミュレーションデータの活⽤も万能ではなく、特にマルチエー ジェントシミュレーションには課題がある。 26