ドライブレコーダの動画を使った道路情報の自動差分抽出

ドライブレコーダの動画を使った道路情報の自動差分抽出 Mobility Technologies 渡部徹太郎

アジェンダ 1. DRIVE CHARTの紹介 2. 道路情報の自動差分抽出プロジェクト 3. 5つの工夫 4. まとめ
2

自己紹介 ID ：fetaro 名前：渡部徹太郎学生：東京工業大学でデータベースと情報検索の研究 (@日本データベース学会) 職歴： * 野村総合研究所(NRI)
- オンライントレードシステム基盤 - オープンソース技術部隊 * リクルートテクノロジーズ - ビッグデータ分析基盤 * Mobility Technologies - データエンジニアエディタ：emacs派→ IntelliJ派趣味：麻雀、自宅サーバ日本AWSユーザ会 (JAWS) 著書 3

１．DRIVE CHARTの紹介 4

Mobility Technologiesの事業 1. 配⾞関連事業 2. 広告決済事業 3. 乗務員向けソリューション事業 4.
DRIVE CHART ・ドラレコ事業 5. 次世代向けR&D事業 5

DRIVE CHARTの紹介 6 タクシーやトラックなど商用車に向けた、 AI活用の交通事故削減支援サービス『DRIVE CHART』

２．道路情報の自動差分抽出プロジェクト 7

プロジェクトの概要 • 課題 ◦ 自動運転時代においては、地図の更新頻度を上げる必要がある ◦ しかし、更新頻度をあげる為には、作業の効率化が必要 • 解決策
◦ DRIVE CHARTを搭載した車両を動くセンサーとして道路の情報を収集する ◦ 収集した情報を元に自動的に道路情報の差分を見つけ、地図会社に提供する • ゼンリン社と共同開発。２０２０年４月にプレスリリース 1 ヶ月で走行した道路（２３区＋三鷹市＋武蔵野市） 8

システムの概要ドライブレコーダ車両位置の特定道路上の物体を検出車両センサーゼンリン社に提供物体位置の推定
地図との差分抽出 NEW 地図 9

車両位置の特定 - マップマッチ GPSで記録された位置マップマッチした位置道路リンク利用技術(1/4) 10

道路上物体を検出 – 機械学習利用技術(2/4) 11

12 道路上物体を検出 – 機械学習利用技術(2/4)

正確な位置を推定 – SLAMの利用利用技術(3/4) 13

地図との差分抽出ー地理情報技術 14 利用技術(4/4) による地理情報操作 + SELECT * FROM
map WHERE ST_Contains (area , ST_Geogpoint( 139.7424, 35.6561) )

DRIVE CHART システム構成図マップマッチ動画取得道路計算位置位置格納動画格納
物体検出位置推定物体差分判定地図差分判定結果動画 AWS Batch S3 Lambda Lambda TypeScript CI / CD 15 by 分析・開発

3．5つの工夫 16

システム構成図 17 5つの工夫はここの話！ DRIVE CHART システム構成図マップマッチ動画取得
道路計算位置位置格納動画格納物体検出位置推定物体差分判定地図差分判定結果動画 AWS Batch S3 Lambda Lambda TypeScript CI / CD 17 by 分析・開発

5つの工夫 1. 動画キャッシュファイルシステム 2. 分散処理サービスの選定 3. ジョブのオーケストレーション 4. 仮想マシン選定 5.
開発フレームワーク 18

動画キャッシュファイルシステム(1/2) 19 標識検出ワーカ信号検出ワーカ停止線検出ワーカ動画ストレージ S3 ダウンロードダウンロード
ダウンロード • やりたいこと ◦ 同じ動画に対して、複数のワーカーで異なった物体認識処理をする • 問題点 ◦ ワーカ毎に同じ動画をローカルにダウンロードする必要がある

• 解決策 ◦ FSx for Lustreを使うことにより、S3からのダウンロードを１回にでき、システム全体のIOスループットを向上できる動画キャッシュファイルシステム(2/2) 20 S3
標識検出ワーカー信号検出ワーカー停止線検出ワーカー FSx for Lustre 動画ストレージ動画キャッシュ初回アクセス時に S3からダウンロード以後はS3からダウンロード不要

分散処理サービスの選定 (1/4） • 典型的な機械学習推論のワークロードはこんな感じだが 21 推論処理 S3 推論処理
{label = "猫"} S3 {label = "犬"} ・・・・・・

分散処理サービスの選定 (2/4) • 物体検出は典型的な機械学習推論のワークロードではない 22 フレ｜ム間
追跡処理する動画の検索状態管理 DB 結果格納メモリ上で画像に分解不要な画像のフィルタ物体検出自由度の高いカスタムコンテナが必要 FSx for Lustre

分散処理サービスの選定 (3/4) • カスタムコンテナの分散バッチ実行環境の選択肢は４つある 23 SageMaker batch transform jobs +
カスタムコンテナ AWS Batch ECS EKS 概要機械学習の推論サービス。それをカスタムコンテナで動かすコンテナベースのバッチを動かすサービス汎用コンテナ実行環境。オンラインもバッチもできる。 Kubernetesベースの汎用コンテナ環境。運用インスタンス管理不要インスタンス管理不要 GPUを使う場合は、Fargate が使えず、インスタンスの管理が必要 Kubernetesの学習コストが高い開発・運用工数：小制約：強開発・運用工数：大制約：弱運用工数のかかるECSとEKSは外した

分散処理サービスの選定 (4/4) SageMaker batch transform jobs + カスタムコンテナ比較 AWS
Batch 並列実行の制御 △ ・自動で入力データの分割可能 →DBを検索して処理対象を選ぶ必要があるため、今回は利用できない＝ △ ・自前で開発が必要推論処理の実装 × ・システム構成が複雑・HTTPの推論エンドポイント公開が必要だが、推論の入力には使わない。・ファイルシステムの利用ができない。 < △ ・システム構成がシンプル・ファイルシステムが利用できる推論コンテナ SagaMeker batch transform jobs 推論コンテナダミー入力 S3 推論の入力 HTTP HTTP 推論コンテナ推論コンテナ AWS Batch ファイルシステム推論の入力 24 SageMakerのフレームワークを活用できないため、AWS Batchを選択した S3

ジョブのオーケストレーション(1/2) • やりたいこと ◦ 車両からくる約５分のデータ毎に物体認識と位置推定を行いたい ◦ 物体認識と位置推定は順序関係があるため、それを表現したい ◦ 物体認識はGPUマシン、位置推定はCPU(※)マシンで動かしたい 25
標識検出2 位置推定2 信号検出2 停止線検出2 標識検出1 位置推定1 信号検出1 停止線検出1 0:00~0:05の処理 0:05~0:10の処理・・・ on CPU on GPU on CPU on GPU ※)SLAMの内部で行っている最適化計算がGPUの並列処理に向かないため、 CPUの計算となる

ジョブのオーケストレーション(2/2) AWS Batchのdependencyを用いて順序を制御 GPU ジョブキュー CPU ジョブキュー GPUマシン
AWS Batch Compute Environment CPUマシン AWS Batch API CPUマシン CPUマシン … GPUマシン … GPUマシン標識検出2 位置推定2 信号検出2 停止線検出2 ジョブ標識検出1 位置推定1 信号検出1 停止線検出1 位置推定1 位置推定2 標識検出1 信号検出1 停止線検出1 標識検出2 信号検出2 停止線検出2 AWS Batch Job Queue dependency AWS Batch Job Queue ・・・・・・・・・ 26 設定だけで、異なるインスタンス間でのジョブオーケストレーションが可能 • 解決策：AWS Batchを使いこなす

仮想マシン選定 (1/3) • やりたいこと ◦ 最も少ないクラウドコストで、日次処理を行いたい • 考え方 ◦ 一枚の画像の処理速度は重要ではない
▪ 理由：24時間のバッチウインドウにおさまればよいため ◦ 一枚の画像をいくらのお金で処理できるかのコストパフォーマンスが重要 27 コストパフォーマンス = 処理画像数(枚/h) インスタンスコスト($/h) 例：処理速度だとp3.2xlargeが最も速いが、コストパフォーマンスはg4dn.xlargeがよい

仮想マシン選定 (2/3) • GPUを用いた４つの物体検出タスクは「g4dn.xlarge」が最善 28 タイムアウトタイムアウトタイムアウト

仮想マシン選定 (3/3) • CPUを用いた位置推定タスクは「c4.xlarge」が最善 ◦ CPUを多く搭載しても、処理速度は速くならないため、最小のc4.xlargeがよい 29

開発フレームワーク (1/2) • 開発チームはサイエンティスト５人、エンジニア２人のチーム • サイエンティストには実行環境を意識すること無く、開発できるようにしたい • フレームワークを作った ◦ データサイエンティストは以下のような成果物を作るだけで良い
30 ROOT / ├── Pipfile # 必要なPythonライブラリを列挙 ├── Pipfile.lock ├── install.sh # Pythonライブラリ以外のインストールコマンド ├── lib / # フレームワークから実行される処理を実装 │ ├── logic.py └── test / # テストを実装 └── test_logic.py サイエンティストはピュアなPythonのコードを書くだけで良い

CloudWatch Logs 開発フレームワーク (2/2) 31 ロギング物体認識処理サイエンティストの成果物 Python
データ構造に変換計算資源提供出力の格納 Aurora 動画 Aurora S3 SQS ファイルシステムとしてアクセス位置速度加速度フレームワーク入力の提供引数として提供 FSx for Lustre AWS Batch マウント

4．まとめ 32

まとめ • プロジェクトの概要 ◦ DRIVE CHARTからとれるタクシーやトラックの情報から、物体を検出して、地図を更新するための情報を地図会社に提供 • 5つの工夫 ◦
動画キャッシュファイルシステム ▪ FSx for Lustreを導入しS3のキャッシュとして利用 ◦ 分散処理サービスの選定 ▪ カスタムコンテナを利用できるAWS上の４つサービスを比較し、AWS Batchを選択 ◦ ジョブのオーケストレーション ▪ AWS Batchの機能を活用して、開発無しでオーケストレーションを実現 ◦ 仮想マシン選定 ▪ コストパフォーマンスを計算し、処理ごとに最適な仮想マシンを選定した ◦ 開発フレームワーク ▪ サイエンティストが実行環境を意識せずに開発できるようにした 33

エンジニア募集中！ 34

ドライブレコーダの動画を使った道路情報の自動差分抽出

ドライブレコーダの動画を使った道路情報の自動差分抽出

fetaro

More Decks by fetaro

Other Decks in Technology

Featured

Transcript