Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定

Dual Quadric表現を用いた動的物体追跡と RGB-D・IMU制約の密結合によるオドメトリ推定島田豊藏*1*2 小出健司*2 高野瀬碧輝*2 大石
修士*2 横塚将志*2 三浦純*1 *1 豊橋技術科学大学 *2 産業技術総合研究所 1

2 概要

3 概要 3 ⚫ 動的環境に対して極めて頑健なオドメトリ推定システムを提案 ⚫ 周囲物体の継続的な推定と点群・IMU位置推定をタイトカップリング ⚫ 周囲環境の情報を余すことなく位置推定に寄与させる

4 研究背景・目的

5 研究背景・目的 5 静的な環境マッチング動的な環境マッチング成功！失敗... ⚫
点群SLAMにおけるスキャンマッチングでの例 SLAMは静的な環境を仮定 SLAMは一般に静的環境を仮定 ⇒ 動的環境では破綻

6 研究背景・目的 6 ⚫ 動的な部分はノイズであるとみなし，センサデータから除去 ⚫ 残った静的な情報を用いて位置推定を行う動的物体への従来の対処 RF-LIO [Qian+,
IROS2021] DS-SLAM [Chao+, IROS2018] V3D-SLAM [Dang+, IROS2024]

7 研究背景・目的 ⚫ 動的な部分はノイズであるとみなし，センサデータから除去 ⚫ 残った静的な情報を用いて位置推定を行う ⇒動的物体が多数存在するような極めて動的な環境では？ 7 動的物体への従来の対処動的要素の検出→除去
残存データ同士で推定マッチング困難... 従来手法は本質的に周囲の環境情報を捨てる極めて動的な環境では静的なデータが十分に残存せず推定は困難

8 研究背景・目的極めて動的な環境下でも破綻しないオドメトリ推定手法の開発 8 本研究の目的アプローチ ⚫ 動的物体をノイズとして除去するだけでなく，Object SLAMの枠組みを拡張しランドマークとしてモデル化 ⚫
周囲環境の情報を余すことなくオドメトリ推定に寄与させる Object SLAMの拡張移動物体の継続的推定点群-IMU SLAM 点群ノイズ除去統合動的物体の状態とセンサ姿勢を同時に推定 ⚫ 動的物体を点群から適応的に除去 ⚫ 動的物体をランドマーク利用

9 手法

10 Dual Quadric表現 10 Dual Quadric [Nicholson+, RA-L2018] ⚫ Object
SLAMにおける物体表現手法のひとつ QuadricSLAM [Nicholson+, RA-L2018] 物体姿勢物体半径 Dual Quadric ファクタグラフ最適化との相性 ◦ 任意物体のランドマーク化 Object SLAM ⚫ 周囲の物体レベルの情報を直接ランドマークとして利用 ⚫ 物体指向地図を作成検出結果と物体間を滑らかに制約物体を3次元楕円体として近似画像で検出した任意物体を利用可能

11 Dual Quadric表現 11 Dual Quadric [Nicholson+, RA-L2018] ⚫ Object
SLAMにおける物体表現手法のひとつ QuadricSLAM [Nicholson+, RA-L2018] 物体姿勢物体半径 Dual Quadric ファクタグラフ最適化との相性 ◦ 任意物体のランドマーク化 Object SLAM ⚫ 周囲の物体レベルの情報を直接ランドマークとして利用 ⚫ 物体指向地図を作成検出結果と物体間を滑らかに制約物体を3次元楕円体として近似従来手法[Nicholson+, RA-L2018]では姿勢・形状の推定のみに留まる ⇒ 本研究では物体並進速度も推定変数として追加

12 提案手法 12 RGB画像深度点群 IMU YOLOv11 物体マスク画像物体画像特徴量物体バウンディング
ボックス物体抽出物体観測の対応付け動的点判別・除去グラフ最適化インスタンスセグメンテーション ⚫ 画像・深度点群・IMUを入力としてセンサと物体状態を同時に推定する ⚫ 物体推定結果をもとに点群から適応的に動的物体を除去 ⚫ 除去した箇所を物体観測の制約で補う形で最適化

13 提案手法 13 周囲物体の抽出 YOLOv11 Instance Segmentation インスタンスセグメンテーション視覚特徴ベクトルはYOLOのFeature Mapとマスク領域を照
合することで抽出

14 提案手法 14 周囲物体の抽出 YOLOv11 Instance Segmentation インスタンスセグメンテーション Dual Quadricの初期パラメータ抽出
Point Cloud 楕円体フィッティング ⚫ 物体マスク画像と点群情報を照合し物体の3次元点群を抽出 ⚫ 物体点群にフィットするような楕円体を大まかに推定 ⚫ ファクタグラフ最適化における初期値視覚特徴ベクトルはYOLOのFeature Mapとマスク領域を照合することで抽出

15 提案手法 15 観測物体と追跡中の物体インスタンスを対応付け ➀ 物体運動 ➁ 視覚特徴の両方を用いてロバストに対応付けを行う追跡中の物体インスタンス ⚫
物体姿勢・形状 ⚫ 物体並進速度 ⚫ 視覚特徴分布各追跡物体が保持する情報観測物体？

16 提案手法 16 観測物体と追跡中の物体インスタンスを対応付け ➀ 物体運動 ➁ 視覚特徴の両方を用いてロバストに対応付けを行う追跡中の物体インスタンス ⚫
物体姿勢・形状 ⚫ 物体並進速度 ⚫ 視覚特徴分布各追跡物体が保持する情報観測物体？過去に対応づいた物体の特徴分布を正規分布(768次元)として保持

17 提案手法 17 物体運動を用いた対応候補の絞り込み出現予測各追跡物体に対し現在時刻における出現位置を予測等速運動モデルを仮定

18 提案手法 18 物体運動を用いた対応候補の絞り込み各追跡物体に対し現在時刻における出現位置を予測予測位置から一定距離内の観測物体を対応付け候補等速運動モデルを仮定候補！候補！出現予測
観測物体

19 提案手法 19 物体視覚特徴分布を用いた対応決定観測物体の視覚特徴量から各追跡物体の視覚特徴分布に対する対数尤度を算出し，最も尤度が高いものを対応付け対応決定！各追跡物体は，対応づいた過去の観測物体の特徴量から視覚特徴分布を構築・保持・更新する ⇒ 視覚特徴の変化に頑健な対応付けが可能

20 提案手法 20 物体視覚特徴分布を用いた対応決定各追跡物体は，対応づいた過去の観測物体の特徴量から視覚特徴分布を構築・保持・更新する ⇒ 視覚特徴の変化に頑健な対応付けが可能観測物体の視覚特徴量から各追跡物体の視覚特徴分布に対する対数尤度を算出し，最も尤度が高いものを対応付け視覚特徴分布の更新
逐次更新アルゴリズム[B. P. Welford+, 1962] を適用することで分布の更新を行う ⇒ 過去の全特徴量を保持せずコスト小対応決定！

21 提案手法 21 観測物体の視覚特徴量から各追跡物体の視覚特徴分布に対する対数尤度を算出し，最も尤度が高いものを対応付け対応決定！動的点除去対応先の物体が一定以上の速度を持つ ⇒ 観測物体に対応する点群除去
視覚特徴分布の更新逐次更新アルゴリズム[B. P. Welford+, 1962] を適用することで分布の更新を行う ⇒ 過去の全特徴量を保持せずコスト小物体視覚特徴分布を用いた対応決定各追跡物体は，対応づいた過去の観測物体の特徴量から視覚特徴分布を構築・保持・更新する ⇒ 視覚特徴の変化に頑健な対応付けが可能

22 提案手法 22 ファクタグラフ最適化動的点除去後の点群レジストレーション＋IMU＋物体観測を制約としたファクタグラフ(目的関数)を構築し，センサ状態と物体状態を同時に最適化するこの目的関数を同時に最適化すること(タイトカップリング)により点群マッチングが困難な環境でも物体観測で補いながら推定可能！

23 IMU事前積分ファクタああああああ点群レジストレーションファクタああああああああ提案手法 23 点群・IMU制約 GLIM[Koide+, RAS2024]のオドメトリ推定ファクタグラフを利用 GPUで高速化されたVoxelized GICP誤差[Koide+,
RA-L2021]を直近5秒の全フレーム間で生成 ⇒ ウィンドウ内の点群全体でレジストレーション誤差を最小化 ⇒ 動的点除去後の疎な点群同士の小さな重なりまで評価 IMUデータを積分して得た相対運動と状態から予測される相対運動の誤差を最小化[Forster+, T-RO2017] ⇒ センサの高速な運動に対して頑健化センサ状態変数

24 バウンディングボックスファクタあああああああああ提案手法 24 物体観測制約画像平面上に投影したDual Quadricに外接するBBoxと観測 BBox間の誤差を最小化[Nicholson+, RA-L2018] Dual
Quadric の投影→BBox 化観測BBox センサ状態変数物体状態変数

25 形状一貫性ファクタあああああ物体アンカーファクタあああああ提案手法 25 物体観測制約 BBoxファクタは物体のスケールを制約できない ⇒ 物体点群情報を用いて3次元相対位置を制約見えの変化により同じ物体に対してBBoxの大きさが変わる
⇒ 物体形状パラメータが時間変化 ⇒ 物体形状は短期間で一定であると仮定し時間変化を抑制センサ状態変数物体状態変数

26 物体速度ファクタああああ提案手法 26 物体運動制約物体運動として等速運動モデルを仮定 ⇒ 連続する物体状態と物体並進速度状態を制約物体並進速度時刻tでの位置予測
物体位置予測物体速度変数物体状態変数

27 速度一定ファクタああああ提案手法 27 物体運動制約物体運動は短期間で一定であると仮定 ⇒ 連続する物体速度間に適用し物体並進速度の平滑化を行う物体速度変数

28 提案手法 28 全体の目的関数 + + + + + +
+ 点群レジストレーションファクタ IMU事前積分ファクタセンサ初期姿勢ファクタ物体位置を制約物体形状を制約物体運動を制約 = 目的関数バウンディングボックスファクタ形状一貫性ファクタ物体運動ファクタ速度一定ファクタこの目的関数を同時に最適化することで周囲の物体運動と静的データ同士のマッチングを両方考慮しながら最適化が可能となる物体アンカーファクタ

29 実験・評価

30 実験・評価 30 実験環境とデバイス廊下(3ヶ所) • 廊下を一周しながらデータ取得 • センサ前方に常に2～4人の人物継続的な動的環境
幾何特徴の縮退室内(1ヶ所) 階段(1ヶ所) • 1～3階を昇降しながらデータ取得 • センサ前方に常に2人の人物継続的な動的環境立体的なセンサ運動 • 6人の人物が室内の家具を再配置 • 椅子や机など，人間以外も動的継続的な動的環境多種多様な物体クラス以下3種類の動的環境を用意し評価データ取得にはMicrosoft AzureKinectを使用 Microsoft AzureKinect

31 実験・評価 31 比較手法手法名種別動的環境への対処 GLIM K. Koide+,
RAS, 2024 QuadricSLAM L. Nicholson+, RA-L, 2017 VOOM Y. Wang+, RA-L, 2024 DS-SLAM C. Yu+, IROS, 2018 V3D-SLAM T. Dang+, IROS, 2024 DynaVINS S. Song+, RA-L, 2022 3D LiDAR SLAM Object SLAM Object SLAM RGB-D SLAM RGB-D SLAM Visual -Inertial SLAM

32 実験・評価 32 提案手法の動作(動画)

33 実験・評価 33 推定精度の定量評価相対姿勢誤差を用いて評価廊下1 廊下2 廊下3 階段提案手法が多くのシーケンスで最も高精度
最高精度次点提案手法室内

34 実験・評価 34 アブレーション分析 ⚫ 提案手法から各機能を除いた3条件でアブレーション分析を実施 (評価：相対姿勢誤差) ⚫ ab_1 :
動的点群除去処理を省略 ⚫ ab_2 : 物体状態の推定および動的点群除去を省略 (LiDAR-IMU only) ⚫ ab_3 : 物体状態の推定のみ省略，動的点群除去は実施廊下1 廊下2 廊下3 階段周囲物体のランドマーク利用が位置推定精度に寄与室内提案手法

35 まとめ 35 まとめ ⚫ 移動物体の状態推定と点群・IMU姿勢推定を密に統合するオドメトリ推定手法を提案 ⚫ 動的な情報を除去するだけでなく，Object SLAMの枠組みを用いたランドマーク化と組み合わせることにより周囲環境情報を余すことなく自己位置推定に寄与させる
⚫ 評価実験を通して，極めて困難な動的環境において高精度な推定が可能であることを確認

Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定

Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定

Toyozo Shimada

Other Decks in Research

Featured

Transcript