Slide 24
Slide 24 text
⼀⼈称視点ビデオ → 頭部姿勢推定
• HeadNet
• 推定したいもの:
距離列 𝑑", 𝑑#, … , 𝑑!
と頭部の回転 𝑅", … , 𝑅!
• angular velocity も推定される
• ⼊⼒するもの:
オプティカルフロー特徴 𝑜", … , 𝑜!
• 事前学習済みの ResNet-18 で特徴抽出
• モデルの構造は GravityNet と同様
• 単眼 SLAM の出⼒のスケールが、現実の 3D 世界に対して⼀貫性を持たない可能性が
あるので、連続する時間ステップの中での差分 𝑑&
を推定する
• ロスは ℒ = ℒ'()& + ℒ*+, + ℒ-.&
2023/04/30 24