Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【Developers IO Dey One】 Passregi CVの現在と取り組んできた改良

【Developers IO Dey One】 Passregi CVの現在と取り組んできた改良

Hiroki YAMAMOTO

April 12, 2023
Tweet

More Decks by Hiroki YAMAMOTO

Other Decks in Technology

Transcript

  1. 2 自己紹介 名前:山本 紘暉 Hiroki Yamamoto 所属:クラスメソッド株式会社 新規事業統括部 Passregiチーム(カフェチーム) 担当:CV・MLの研究開発

    経歴 - 1991 千葉県浦安市育ち - 2016~ 電機メーカで情報系の研究開発 - 2020~ クラスメソッドでCVの研究開発
  2. 14 CV部分の改良 2018.05 ~ 2020.04 Phase0 追跡 (※) 2020.04 ~

    2020.10 Phase1 複数人で取得判定 2020.11 ~ 2020.12 Phase2 連続手伸ばし判定 2021.01 ~ 2021.05 (他の試行錯誤) 2021.06 ~ 2021.09 Phase3 追跡を実装 2021.11 ~ 2021.12 Phase4 骨格のみに変更 2022.01 ~ 2022.03 Phase5 クラウド版を実装 2022.04 ~ (中断) Phase6 クラウド版を改良 2022.05 ~ Phase7 RGBのみを試す V1 V1.5 V2 V3 2020.05 山本ジョイン ※ 詳しくは https://dev.classmethod.jp/articles/report-developers-io-2019-tokyo-yokota-developersiocafe/
  3. 25 Phase3:使用した技術要素 フィルタ (カルマンフィルタ) SORT (Simple Online and Realtime Tracking)

    MOT (Multiple Object Tracking) https://arxiv.org/abs/1602.00763 t=n-2 (検出) t=n-1 (検出) t=n (予測)
  4. 36 Phase7:課題と解決方法(取り組み中) 課題 :RGB-Depthカメラの価格が高い 解決方法:RGBカメラで3次元の検出・追跡 Epipolar幾何 ATOM Cam2 https://www.atomtech.co.jp/products/atomcam2 https://en.wikipedia.org/wiki/Epipolar_geometry#/

    media/File:Epipolar_geometry.svg Incremental Tracking https://openaccess.thecvf.com/content_CVPR_202 0/html/Chen_Cross-View_Tracking_for_Multi- Human_3D_Pose_Estimation_at_Over_100_CVPR_ 2020_paper.html
  5. 38 骨格検出(エッジデバイス) Jetson AGX Orin 高性能GPUデバイス (従来の5倍の性能、カタログ上) 価格:35万円くらい TensorRT モデルの構成をNVIDIA

    GPU用に 最適化するライブラリ スループット:PyTorchの5.4倍程度 (PyToch32bit → TensorRT16bit) → 1台で骨格検出処理を400fps(カメラ100台分の映像)を処理可能
  6. 40 機器構成と流れるデータ 撮影 カメラ エッジ デバイス (GPU) 骨格検出 骨格追跡 追跡

    訂正・制約 PC PC 2次元座標 * n 3次元座標 RGB映像 * n IDを上書き
  7. 47 Phase7:使用している技術要素(1)Epipolar幾何 問題点 0 1 2 3 0 ー 0,1

    0,1 0,1 1 0,1 ー 0,1 0,1 2 0,1 0,1 ー 0,1 3 0,1 0,1 0,1 ー 0 1 2 3 4 5 6 7 8 9 10 11 0 ー 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 1 0,1 ー 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 2 0,1 0,1 ー 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 3 0,1 0,1 0,1 ー 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 4 0,1 0,1 0,1 0,1 ー 0,1 0,1 0,1 0,1 0,1 0,1 0,1 5 0,1 0,1 0,1 0,1 0,1 ー 0,1 0,1 0,1 0,1 0,1 0,1 6 0,1 0,1 0,1 0,1 0,1 0,1 ー 0,1 0,1 0,1 0,1 0,1 7 0,1 0,1 0,1 0,1 0,1 0,1 0,1 ー 0,1 0,1 0,1 0,1 8 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 ー 0,1 0,1 0,1 9 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 ー 0,1 0,1 10 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 ー 0,1 11 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 ー … 変数の数: 9倍 探索空間: ✕:9倍 ◯:2**(144-16)倍 =340282366920938463463374607431768211456倍 人数3倍