Upgrade to Pro — share decks privately, control downloads, hide ads and more …

E2E 自動運転モデル開発 on AWS / e2e autonomous driving o...

riita10069
December 05, 2024
130

E2E 自動運転モデル開発 on AWS / e2e autonomous driving on aws

riita10069

December 05, 2024
Tweet

More Decks by riita10069

Transcript

  1. UniAD @ CVPR2023 by OpenDriveLab https://arxiv.org/pdf/2212.10156 Input • 6x camera

    images • Transformation between camera • Navi, forward or left/right CrossAttentionによるベクトル更新 Output • BEV Feature • Multi Object Tracking • Segmented map • Trajectories of Top-k
  2. From Model-centric to Data-centric AI https://www.youtube.com/watch?v=06-AZXmwHjo AI System = Model

    Algolism + Training Data Model-centric Approach Data-centric Approach 改善 改善 アルゴリズムは、Transformer で固定して データの量を増やしたり品質を改善する その⽅がモデルの改善に⼤きく寄与する
  3. From Model-centric to Data-centric AI https://www.youtube.com/watch?v=06-AZXmwHjo AI System = Model

    Algolism + Training Data Model-centric Approach Data-centric Approach 改善 改善 アルゴリズムは、Transformer で固定して データの量を増やしたり品質を改善する その⽅がモデルの改善に⼤きく寄与する BigData + Good Data
  4. ⾃動運転 AI の本題へ – 課題はロングテール問題 https://arxiv.org/pdf/2305.07497 IEEE TRANSACTIONS ON INTELLIGENT

    TRANSPORTATION SYSTEMS 1 Dynamically Conservative Self-Driving Planner for Long-Tail Cases Weitao Zhou, Zhong Cao, Nanshan Deng, Xiaoyu Liu, Kun Jiang, Diange Yang 現代の技術では、99 % の運転時間において AI による自動運転は可能 しかし、 100 % でないと完全自動運転とは言えない 難しい状況に限ってトレーニングデータにない
  5. 第3世代データセット – ⽣成 AI によって⽣成 : Xu et al. "State-of-the-art

    Autonomous Driving Datasets: Classification and Development." arXiv preprint arXiv:2401.12888 (2023). https://arxiv.org/pdf/2401.12888
  6. 世界シミュレーター • 世界シミュレーター as Dataset • 滅多に起こらない状況を作成することでパラメータの活性化 • 様々な時空間点を作成することで共変量シフト問題への解決 •

    世界シミュレーター as Simulator • のちに紹介する Closed-loop なアプローチで利⽤可能 • 世界シミュレーター as AD Model • ⾃動運転モデルそのもののサブタスクの⼀つとしても考えられる
  7. 閉ループ駆動型データプラットフォーム Data-Centric Evolution in Autonomous Driving: A Comprehensive Survey of

    Big Data System, Data Mining, and Closed-Loop Technologies, https://arxiv.org/html/2401.12888v2 (I)データ収集 (II)データ保存 (III)データ選択と前処理 (IV)データラベリング (V)ADモデルトレーニング (VI)シミュレーション/テスト検証 (VII)実世界展開
  8. (I)データ収集(II)データ保存: IoT Greengrass Camera/GNSS/LiDAR IoT Greengrass Connected Car installed IoT

    Greengrass Core AWS Cloud MQTT topic AWS IoT Core Device management IoT Rule Certs management
  9. (III)データ選択と前処理 • 保存したデータには何があるか • Probe, LiDAR, Camera, NIR(近⾚外線), GNSS etc…

    • ETL • 動画から画像への変換 • 歪みの矯正 • バリデーションやクレンジング • フレーム⾶び • カメラの前に障害物があり何も映ってないもの • ファイル⾃体の破損 • メタデータの収集(timestamp, GNSS, 天気、気温、⾛⾏速度 etc...) • MLモデルを利⽤した加⼯ Python Shell Sagemaker Processing
  10. (IV)データラベリング – NVIDIA MegLev https://www.youtube.com/watch?v=HuIWTwE28QE ⼿動のラベリングもツールによって効率化 • Segment Labeler •

    これはビデオの特定の区間にタグを付ける • 2D Image Labeling • オブジェクト検出のためのバウンディングボックス • LiDAR Labeling • カメラと連携する • Sensor Fusion のために必要なラベルがある • Object Tracking • 複数フレームにわたって同じオブジェクトを追跡
  11. (V)モデルトレーニング – AWS Trainium & JARK AWS Trainium および Inferentia

    GPU に⽐べて、AWS での 1000 億パラメータ以上の 基盤モデルおよび⼤規模⾔語モデルの DL トレーニングでコストを最⼤ 50% 削減 深層学習の推論アプリケーションでコストを最⼤ 70% 削減し、スループットを 2.3 倍に向上 Neuron SDK AWS Trainium 向けに深層学習モデルを最適化するよう調整 Ray フレームワーク Ray Data は分散データ読み込みを簡素化し、クラウドストレージからファイルを効率的に読み取り、 トレーニング⽤にデータを分割するためのシンプルなインターフェイスを提供します。 Ray Train は、複数のコンピューティングノードにまたがる分散トレーニングを簡素化します。 Ray Tune は実験の実⾏とハイパーパラメータのチューニングを⾏います。 Ray Serve はオンライン推論 API を構築するためのモデルサービングライブラリです。 https://awslabs.github.io/data-on-eks/docs/blueprints/ai-ml/jark JARK on EKS
  12. Mobileye 事例 https://aws.amazon.com/jp/blogs/news/mobileyes-journey- towards-scaling-amazon-eks-to-thousands-of-nodes/ 1 つのクラスターで、最大 40,000 Pod、100,000 以上の vCPU

    が存在する、最大 3,200 ノードまでスケール可能 数千の Spark エグゼキューターを起動する Spark クラスター GPU や Habana Gaudi アクセラレーターなど、必要な時に 利用できるだけの計算能力を利用 Mobileye では、最先端のカメラ、コンピューターチップ、 およびソフトウェアを使用して、自動運転技術と先進運 転支援システム (ADAS) を開発しています。Mobileye の AI エンジニアリング部は、ワークフロー、DAG、ML/DL の学 習ワークフロー、基本的なバッチジョブなど、多様なタ イプのワークロードを実行する様々なエンジニアリング チームをサポートしています。