Slide 8
Slide 8 text
この現象をより⼀般化する
Stateが学習分布外(OOD)な例:⾃動運転の世界モデルに室内の映像を⽣成させる
ActionがOODな例:ロボットの世界モデルに2回宙返りの映像を⽣成させる
State × ActionがOODな例 (Joint OOD):今回のケース(Causal Misalignment)
予測分布からの採取時にOODになる例(Rollout OOD):⾃⼰回帰動画⽣成でEncode
→Decodeを繰り返すと劣化していく
→普通にデータを集めても得られないケースについて世界モデルに⽣成させるには? 8