Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
論文紹介 "ReSim: Reliable World Simulation for Auto...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Takuma Kogo
April 02, 2026
Research
610
0
Share
論文紹介 "ReSim: Reliable World Simulation for Autonomous Driving"
NeurIPS2025 spotlight論文
Takuma Kogo
April 02, 2026
Other Decks in Research
See All in Research
「なんとなく」の顧客理解から脱却する ──顧客の解像度を武器にするインサイトマネジメント
tajima_kaho
10
7.6k
R&Dチームを起ち上げる
shibuiwilliam
1
260
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
340
Apache Gravitinoで実現する Icebergカタログ統合とアクセスの一元化
matsumooon
0
250
COFFEE-Japan PROJECT Impact Report(Uminomukou Coffee)
ontheslope
0
160
Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定
nanoshimarobot
0
400
SoftMatcha 2: 1兆語規模コーパスの超高速かつ柔らかい検索
e869120_sub
6
3.4k
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
520
計算情報学研究室(数理情報学第7研究室)2026
tomohirokoana
0
500
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
800
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
190
2026年3月1日(日)福島「除染土」の公共利用をかんがえる
atsukomasano2026
0
620
Featured
See All Featured
Building AI with AI
inesmontani
PRO
1
1k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
570
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
250
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.9k
Facilitating Awesome Meetings
lara
57
6.9k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
400
The agentic SEO stack - context over prompts
schlessera
0
790
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
Thoughts on Productivity
jonyablonski
76
5.2k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
190
Transcript
AI Community 2026.01.29 向後 卓磨 GOドライブ株式会社 論文紹介 ReSim: Reliable World
Simulation for Autonomous Driving
紹介する論文 大量の実データ 安全走行 少量のシミュレーションデータ 危険走行 ▪ “ReSim: Reliable World Simulation
for Autonomous Driving” [1] ▪ NeurIPS’25 Spotlight論文 ▪ 自動運転における世界モデルの一活用形態/学習方法を提案 学習 動画 予測 軌道計画を入力 衝突するような 軌道計画でも 妥当な映像を予測 従来手法 提案手法 十分に曲がってくれない
論文のスコープ ▪ タスク:環境認識(予測含む) + 局所の軌道計画 ▪ 前提 :自己位置と広域の経路計画が与えられている 自動運転のコンポーネント
先行研究:運転世界モデルによる動画予測 “Vista: A Generalizable Driving World Model with High Fidelity
and Versatile Controllability” (NeurIPS’24) [2] 学習フェーズ [1st] アクション入力なし 多量データ [2nd] アクション入力あり 少量データ→LoRA 予測フェーズ 1. 過去数フレーム+アクション → 次フレームを予測 2. 予測したフレームを入力に加えて自己回帰 → 5~15秒 (576x1024@10Hz) モデル:Stable Video Diffusion
課題:運転世界モデルにおける「安全性バイアス」 入力 予測結果 ↑ コースアウトせず道路に残留 ↓ 道路から右方へコースアウト 従来手法
提案手法 軌道計画 初期位置を原点 とした相対座標 ▪ 実運転データのほとんどは安全走行 → 危険走行シーンを予測できない ▪ 誤った予測結果を基に軌道計画がなされてしまう 走行道路から コースアウトする 軌道計画 Source: [1] Fig.5
提案手法 ▪ 動画予測:少量のシミュレーションデータを加えて運転世界モデルを学習 ▪ 軌道計画:シミュレーションデータで学習したVideo2Reward 運転動画から 運転の良し悪しを 推定するモデル Source: [1]
Fig.1
【動画予測】モデル 2B DiT (CogVideoX) 過去画像にも ノイズを加える ノイズレベル 時空間的 一貫性 高ノイズを1/2→2/3
に増やす 4M clips (w/o traj.) 85K samples (w/ traj.) 88K simulations VAE Source: [1] Fig.S11
【動画予測】損失関数 GTの動き 予測の動き 長期・短期での時空間的一貫性を保つ 大きい動きに過剰にFitすることを抑制→
【動画予測】学習 OpenDV Real カメラキャリブレーション無し 高レベルコマンド(例. 右折/直進)をOpenCV toolkitで pesude-labeling 曲がるシーンを5倍サンプリング NAVSIM
Real 軌道情報あり unScenes/Waymoデータを評価用に除外 CARLA Sim Bench2Driveで定義された走行経路から220をサンプル 2種類(安全/危険)のルールベースのエージェントで走行データを50:50で作成 ▪ 3-stageでの学習(GPU A100 x40台で14日間) Source: [1] Table S5
【動画予測】評価:忠実度 主観評価 (3つから好ましいものを選択) FID: Fréchet Inception Distance (画像の分布の近さ ) FVD:
Fréchet Video Distance (動画の動きの自然さ ) 映像上の自車両の軌道誤差推定値 Source: [1] Fig. 4, Table 1-2.
【動画予測】評価:制御性 入力 軌道計画毎の予測結果 Source: [1] Fig. 6
【動画予測】評価:失敗例 ▪ オクルージョンに対して、時系列的な一貫性を保つのが苦手(上段・中段) ▪ 極端なケースにおいてアーティファクトが発生(下段) Source: [1] Fig. S18
【軌道計画】動画報酬モデル backbone: DINOv2 ▪ シミュレータで計算した運転スコアを報酬値として学習したモデル ▪ 運転スコア減点対象:衝突、信号無視、路外逸脱、無意味な減速 軌道計画 1. 各Learned
Policyで軌道計画を算出 2. 各軌道計画毎に動画予測 3. 各予測動画に対して報酬値を算出 4. 最大報酬に対応するPolicyを選択 → その軌道計画を採用する (※ Learned Policy は既存のもの) Source: [1] Fig. 2
【軌道計画】評価:Policy選択 Policy単体 Policy選択 アンサンブル ▪ シミュレータNAVSIM上で運転スコアを評価 ▪ 走行シナリオ:挑戦的な300ケース (Transfuser/LTFのいずれが上手くいかないケース) ▪
評価指標 :運転スコアPDMS (Predictive Drive Model Score) Source: [1] Table 3.
【軌道計画】評価:既存E2Eアプローチとの比較 ▪ シミュレータNAVSIM上で運転スコアを評価 ▪ 走行シナリオ:NAVSIM navtest ▪ 評価指標 :運転スコアPDMS Source: [1]
Table 4.
▪ 少量の危険走行シミュレーションデータを学習データに加えることで 運転世界モデルの動画予測の性能を改善 ▪ 忠実度 ▪ 軌道計画に対する制御性 ▪ シミュレーションデータで学習した動画報酬モデルと動画予測を組み 合わせることで、良好な軌道計画を選択
▪ 拡散モデルの推論の計算負荷が高く、実用に課題あり まとめ
[1] J. Yang, et al., “ReSim: Reliable World Simulation for
Autonomous Driving” , NeurIPS, 2025. [2] S. Gao, et al., “Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability”, NeurIPS, 2024. 参考文献