Slide 75
Slide 75 text
AI
▪ カメラモジュールの出力の角度の埋め込みから入力シーンの深度スケールに
関する事前知識を獲得することが重要
▪ カメラモジュールの内部表現はfx, fy, cx, cy
▪ これらに対応するトークンはスカラー値Δfx, Δfy, Δcx, Δcy
▪ これらはカメラパラメータを直接表すわけではなく以下の式のように乗算誤
差とする
▪ これにより入力画像サイズに対する不変性を保つ
▪ 推定された内部パラメータに基づいて逆投影 -> rayの生成 -> 方位角と仰角
の抽出 -> 角度のテンソルを生成
▪ 光線は正規化され単位球上のベクトルを表す
▪ 球面調和関数で角度のテンソルから埋め込みを作成 -> cross attensionで
depth moduleの条件付け
▪ depthのdecoderはMLP
カメラパラメータのための角度テンソル