深度推定モデルの自己教師あり学習/self-supervised-depth
by
shun74
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
深度推定モデルの 自己教師あり学習 shun sato
Slide 2
Slide 2 text
深層学習モデル(Deep Learning) ● 深層学習モデルはトレーニングを経て推論が可能に �@ュ#ルゥ!ッ&ー%��� 私はCh4tG*Tです。なにかお手伝い できることはありますか? トレーニング
Slide 3
Slide 3 text
深層学習モデルのトレーニングの様子 ● 入力データと教師データの組でトレーニング ①データ入力 入力データ ②推論 ④逆伝搬 正解は 「いぬ」です 教師データ ③損失を計算 これは 「ねこ」です 推論結果 ※逆伝搬:微分による深層学習モデルの重みの更新
Slide 4
Slide 4 text
自己教師あり学習(Self-Supervised Learning) ● 教師データ無しで深層学習モデルを学習する ● なんらかのアルゴリズムで推論結果から損失を計算する 例:深層学習モデルでゲーム対戦をする 勝ち:損失小 負け:損失大 人間に勝つ レベルに成長! AI同士で永遠に対戦
Slide 5
Slide 5 text
深度推定モデル ● 入力画像に対応する深度画像を推定 KITTIデータセット https://www.cvlibs.net/datasets/kitti/ 深度推定で最も有名な大規模データセット 専用車両を使ってデータを収集
Slide 6
Slide 6 text
事前知識:MVS(Multi-View Stereo) ● 複数視点画像から三次元再構成を行うアルゴリズム(深層学習ではない) ● カメラ位置(Camera Pose)と深度(Depth)を推定 1. 特徴点マッチングを使って Camera Poseを推定 2. Camera Poseを調整しながら Depthを推定 気になる人はACMHを調べて読んでみよう!
Slide 7
Slide 7 text
深度推定モデルの自己教師あり学習 ● MVSのアルゴリズムを応用 ⇨ 動画から学習を可能にする! 時間tの画像 時間t+1の画像 時間tの深度 ②深度推定 ①カメラ移動推定 ①②の情報を使って時間t+1の画像を再投影 ⇨時間t+1の画像と損失を計算!
Slide 8
Slide 8 text
画像再投影のイメージ Cam 1の画像 Cam 1の深度 × Cam 1 Cam 2 3D reconstruct Cam Pose Cam 2視点の画像 2D projection
Slide 9
Slide 9 text
研究で取り組んでいること ● 魚眼画像で深度推定モデルの自己教師あり学習 通常レンズに 比べると精度✗
Slide 10
Slide 10 text
データセットは自前で作成 ● Unityで作成! ● 勉強したこと ○ カメラシェーダの変更 ○ 深度バッファの取得
Slide 11
Slide 11 text
まとめ ● 深層学習モデルはトレーニングが必要 ● 自己教師あり学習は教師データがいらない ● 深度推定モデルも自己教師あり学習ができる ● 数学頑張れば魚眼画像でもできる