E2E 自動運転モデル開発 on AWS / e2e autonomous driving on aws

Slide 1

Slide 1 text

E2E ⾃動運転モデル開発 on AWS "⼤"テック業界忘年会 Amazon Web Services Inc. Global Automotive Solutions Architect Ryota Yamada

Slide 2

Slide 2 text

好きなAWSのサービス：趣味：謎解き、サッカー観戦、フットサル得意なこと：夜更かし苦手なこと：早起き Ryota Yamada / riita10069 Global Automotive SA / TFC Containers Lead / TFC Automotive

Slide 3

Slide 3 text

E2E ⾃動運転 https://www.thinkautonomous.ai/blog/tesla-end-to-end-deep-learning/ Traditional: 独⽴したモジュールを複数 Modular: 独⽴したニューラルネットを複数 E2E: 単⼀のニューラルネットが Trajectory を推論

Slide 4

Slide 4 text

UniAD @ CVPR2023 by OpenDriveLab https://arxiv.org/pdf/2212.10156

Slide 5

Slide 5 text

https://driveteslacanada.ca/news/tesla-ai-day-simplified/

Slide 6

Slide 6 text

UniAD @ CVPR2023 by OpenDriveLab https://arxiv.org/pdf/2212.10156 Input • 6x camera images • Transformation between camera • Navi, forward or left/right CrossAttentionによるベクトル更新 Output • BEV Feature • Multi Object Tracking • Segmented map • Trajectories of Top-k

Slide 7

Slide 7 text

Transformer の出現と Scaling Law • Transformerの性能は『（埋め込み層を除く）モデルのパラメータ数 NN』『訓練データセットに含まれるトークン数DD』『訓練計算量CC 』等の変数によって記述される冪乗則に従う Scaling Laws for Neural Language Models (Jared Kaplan, Sam McCandlish et al., 2020-01-23)

Slide 8

Slide 8 text

From Model-centric to Data-centric AI https://www.youtube.com/watch?v=06-AZXmwHjo AI System = Model Algolism + Training Data Model-centric Approach Data-centric Approach 改善改善アルゴリズムは、Transformer で固定してデータの量を増やしたり品質を改善するその⽅がモデルの改善に⼤きく寄与する

Slide 9

Slide 9 text

Slide 10

Slide 10 text

⾃動運転 AI の本題へ – 課題はロングテール問題 https://arxiv.org/pdf/2305.07497 IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS 1 Dynamically Conservative Self-Driving Planner for Long-Tail Cases Weitao Zhou, Zhong Cao, Nanshan Deng, Xiaoyu Liu, Kun Jiang, Diange Yang 現代の技術では、99 % の運転時間において AI による自動運転は可能しかし、 100 % でないと完全自動運転とは言えない難しい状況に限ってトレーニングデータにない

Slide 11

Slide 11 text

⾃動運転 AI の世界でも Data-centric AI Approach1: ⾃動運転⽤データセットの発展 Approach2: 閉ループ駆動型アプローチ

Slide 12

Slide 12 text

第3世代データセット – ⽣成 AI によって⽣成 : Xu et al. "State-of-the-art Autonomous Driving Datasets: Classification and Development." arXiv preprint arXiv:2401.12888 (2023). https://arxiv.org/pdf/2401.12888

Slide 13

Slide 13 text

DriveLM Dataset by OpenDriveLab https://arxiv.org/pdf/2312.14150 217,522フレームのデータ、約280万件のQAペア第⼆世代の nuScenes は30,000フレーム

Slide 14

Slide 14 text

世界シミュレーター • 世界シミュレーター as Dataset • 滅多に起こらない状況を作成することでパラメータの活性化 • 様々な時空間点を作成することで共変量シフト問題への解決 • 世界シミュレーター as Simulator • のちに紹介する Closed-loop なアプローチで利⽤可能 • 世界シミュレーター as AD Model • ⾃動運転モデルそのもののサブタスクの⼀つとしても考えられる

Slide 15

Slide 15 text

GAIA-1 https://arxiv.org/pdf/2309.17080

Slide 16

Slide 16 text

開ループと閉ループ • 開ループ • 現実世界の実⾞両から取得した⾛⾏データを模倣する • 閉ループ • CARLA などのシミュレータを通して⾛⾏能⼒を評価する

Slide 17

Slide 17 text

閉ループ駆動型データプラットフォーム Data-Centric Evolution in Autonomous Driving: A Comprehensive Survey of Big Data System, Data Mining, and Closed-Loop Technologies, https://arxiv.org/html/2401.12888v2 (I)データ収集 (II)データ保存 (III)データ選択と前処理 (IV)データラベリング (V)ADモデルトレーニング (VI)シミュレーション/テスト検証 (VII)実世界展開

Slide 18

Slide 18 text

(I)データ収集(II)データ保存: IoT Fleetwise https://aws.amazon.com/jp/blogs/news/announcing-aws-iot-fleetwise-vision-system-data-preview/

Slide 19

Slide 19 text

(I)データ収集(II)データ保存: IoT Greengrass Camera/GNSS/LiDAR IoT Greengrass Connected Car installed IoT Greengrass Core AWS Cloud MQTT topic AWS IoT Core Device management IoT Rule Certs management

Slide 20

Slide 20 text

(III)データ選択と前処理 • 保存したデータには何があるか • Probe, LiDAR, Camera, NIR(近⾚外線), GNSS etc… • ETL • 動画から画像への変換 • 歪みの矯正 • バリデーションやクレンジング • フレーム⾶び • カメラの前に障害物があり何も映ってないもの • ファイル⾃体の破損 • メタデータの収集(timestamp, GNSS, 天気、気温、⾛⾏速度 etc...) • MLモデルを利⽤した加⼯ Python Shell Sagemaker Processing

Slide 21

Slide 21 text

(IV)データラベリング – オートアノテーション • 3D 静的シーンラベリング • 運転場所(街路、⾼速道路、都市の⾼架道路、メイン道路など) • 天候(晴れ、⾬、雪、霧、雷⾬など) • etc.. • 3D 動的オブジェクトラベリング • ⾞両 • 歩⾏者 • 信号機の⾊ • etc..

Slide 22

Slide 22 text

(IV)データラベリング – Waymo Pipeline LiDAR から教師なし学習により3D物体検出を⾏う⼿法 1.初めに点群からの物体検出を⾏う 2.次に⾃⼰運動(エゴモーション)を除去する 3.シーケンス全体から検出した物体をトラッキングする教師なしで物体検出を⾏うため、⼈⼿によるラベリング作業が不要 Offboard 3D Object Detection from Point Cloud Sequences, https://arxiv.org/pdf/2103.05073

Slide 23

Slide 23 text

(IV)データラベリング – Uber Auto4D 連続的なLiDARポイントクラウドデータから4次元物体ラベルを⽣成 https://arxiv.org/pdf/2101.06586 https://www.youtube.com/watch?v=1cyjlOGXJPM

Slide 24

Slide 24 text

(IV)データラベリング – SelfOcc • NeRF が応⽤され、⾃⼰教師あり学習によりボクセル表現を獲得 • 進度推定、深度合成などのサブタスクでも⾼い性能 https://arxiv.org/abs/2311.12754

Slide 25

Slide 25 text

(IV)データラベリング – NVIDIA MegLev https://www.youtube.com/watch?v=HuIWTwE28QE ⼿動のラベリングもツールによって効率化 • Segment Labeler • これはビデオの特定の区間にタグを付ける • 2D Image Labeling • オブジェクト検出のためのバウンディングボックス • LiDAR Labeling • カメラと連携する • Sensor Fusion のために必要なラベルがある • Object Tracking • 複数フレームにわたって同じオブジェクトを追跡

Slide 26

Slide 26 text

(V)モデルトレーニング – AWS Trainium & JARK AWS Trainium および Inferentia GPU に⽐べて、AWS での 1000 億パラメータ以上の基盤モデルおよび⼤規模⾔語モデルの DL トレーニングでコストを最⼤ 50% 削減深層学習の推論アプリケーションでコストを最⼤ 70% 削減し、スループットを 2.3 倍に向上 Neuron SDK AWS Trainium 向けに深層学習モデルを最適化するよう調整 Ray フレームワーク Ray Data は分散データ読み込みを簡素化し、クラウドストレージからファイルを効率的に読み取り、トレーニング⽤にデータを分割するためのシンプルなインターフェイスを提供します。 Ray Train は、複数のコンピューティングノードにまたがる分散トレーニングを簡素化します。 Ray Tune は実験の実⾏とハイパーパラメータのチューニングを⾏います。 Ray Serve はオンライン推論 API を構築するためのモデルサービングライブラリです。 https://awslabs.github.io/data-on-eks/docs/blueprints/ai-ml/jark JARK on EKS

Slide 27

Slide 27 text

https://pages.awscloud.com/rs/112-TZM-766/images/RECAP_AUTO_4_Automotive-AIML.pdf

Slide 28

Slide 28 text

Mobileye 事例 https://aws.amazon.com/jp/blogs/news/mobileyes-journey- towards-scaling-amazon-eks-to-thousands-of-nodes/ 1 つのクラスターで、最大 40,000 Pod、100,000 以上の vCPU が存在する、最大 3,200 ノードまでスケール可能数千の Spark エグゼキューターを起動する Spark クラスター GPU や Habana Gaudi アクセラレーターなど、必要な時に利用できるだけの計算能力を利用 Mobileye では、最先端のカメラ、コンピューターチップ、およびソフトウェアを使用して、自動運転技術と先進運転支援システム (ADAS) を開発しています。Mobileye の AI エンジニアリング部は、ワークフロー、DAG、ML/DL の学習ワークフロー、基本的なバッチジョブなど、多様なタイプのワークロードを実行する様々なエンジニアリングチームをサポートしています。

Slide 29

Slide 29 text

ご清聴ありがとうございました Global Automotive Solutions Architect Ryota Yamada