• Navigating to Identify All Objects in a Scene • Robotic Vision Scene Understanding(RVSU)のSLAMタ スクでは環境を探索して全てのオブジェクトを意味づけをする • どのオブジェクトがどこにあるかを問われる • 一般的にはセマンティックSLAMとして捉えられる • Audio-Visual Navigation • 従来の画像入力に音を加えたマルチモーダルなナビゲーションタスク • 音を介して環境内の位置を推定する必要がある • 具体的には環境内のランダムな位置に電話などの音源が置かれ、 音情報をもとに探索する RVSUのSLAMタスク Deitke, Matt, et al. "Retrospectives on the embodied ai workshop." arXiv preprint arXiv:2210.06849 (2022). 画像・音情報でオブジェクトを探索する
Linda Smith and Michael Gasser. "The Development of Embodied Cognition: Six Lessons from Babies. Artif." https://cogdev.sitehost.iu.edu/labwork/6_lessons.pdf • Embodied AI Workshop CVPR 2023 https://embodied-ai.org/ • Deitke, Matt, et al. "Retrospectives on the embodied ai workshop.” https://arxiv.org/abs/2210.06849 • The Robotic Vision Challenges(RVSU) https://nikosuenderhauf.github.io/roboticvisionchallenges/scene- understanding.html • AI2-THOR https://ai2thor.allenai.org/ • Habitat 3.0 https://aihabitat.org/habitat3/ • Isaac Sim https://developer.nvidia.com/ja-jp/isaac-sim • ThreeDWorld (TDW) https://www.threedworld.org/ • A SimulAted Part-based Interactive Environment (SAPIEN) https://sapien.ucsd.edu/ • Deitke, Matt, et al. "ProcTHOR: Large-Scale Embodied AI Using Procedural Generation." https://arxiv.org/abs/2206.06994 • Khandelwal, Apoorv, et al. "Simple but Effective: CLIP Embeddings for Embodied AI." https://arxiv.org/abs/2111.09888 • Faust, Aleksandra, et al. "PRM-RL: Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning." https://arxiv.org/abs/1710.03937