AI Deep Learningを用いたVisual Odometryの分類 Deep VO+Traditional VO 組み合わせ方はいろいろ ● CNN-SVO (ICRA’19) ● D3VO (CVPR’20) ● DF-VO (ICRA’20) End-to-End VO Hybrid VO Supervised VO Unsupervised VO 教師ありでposeを推論 CNN+RNNの構造が多い ● DeepVO (ICRA’17) ● DeMoN (CVPR’17) 単眼 or stereoのビデオ だけで学習 大体depth推定とセット ● SfmLearner (CVPR’17) https://arxiv.org/pdf/1709.08429.pdf https://arxiv.org/pdf/1704.07813.pdf https://arxiv.org/pdf/2003.01060.pdf
AI Deep Learningを用いたVisual Odometryの分類 Deep VO+Traditional VO 組み合わせ方はいろいろ ● CNN-SVO (ICRA’19) ● D3VO (CVPR’20) ● DF-VO (ICRA’20) Hybrid VO Unsupervised VO 単眼 or stereoのビデオ だけで学習 大体depth推定とセット ● SfmLearner (CVPR’17) End-to-End VO Supervised VO 教師ありでposeを推論 CNN+RNNの構造が多い ● DeepVO (ICRA’17) ● DeMoN (CVPR’17) https://arxiv.org/pdf/1709.08429.pdf https://arxiv.org/pdf/1704.07813.pdf https://arxiv.org/pdf/2003.01060.pdf
AI ● カメラパラメータを推測するようにした ○ 推論時にカメラパラメータがわかっている場合は補正して さらにVOの精度を上げることができる ● photometric lossを計算する際に、推定したdepthよりも ワープした結果前景にくるpixelだけを使用する ● 物体のbboxを与え、動物体として別でmotionを計算 ● Layer Normalizationの平均と分散にガウシアンノイズ乗算 ○ そのままだと平均と分散が安定しすぎてよくないらしい(謎) 動物体の情報を外部から与える手法②: Depth from Video in the Wild (ICCV’19)
AI Deep Learningを用いたVisual Odometryの分類 Deep VO+Traditional VO 組み合わせ方はいろいろ ● CNN-SVO (ICRA’19) ● D3VO (CVPR’20) ● DF-VO (ICRA’20) Hybrid VO Unsupervised VO 単眼 or stereoのビデオ だけで学習 大体depth推定とセット ● SfmLearner (CVPR’17) End-to-End VO Supervised VO 教師ありでposeを推論 CNN+RNNの構造が多い ● DeepVO (ICRA’17) ● DeMoN (CVPR’17) https://arxiv.org/pdf/1709.08429.pdf https://arxiv.org/pdf/1704.07813.pdf https://arxiv.org/pdf/2003.01060.pdf
AI ● Essential Matrix (基本行列) と R, T の復元 ● patrick-llgc.github.io/Learning-Deep-Learning/ ● Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unknown Cameras ● A Benchmark for the Evaluation of RGB-D SLAM Systems 参考文献(スライド中に記載がないもののみ)