Upgrade to Pro — share decks privately, control downloads, hide ads and more …

NVIDIA Robotics Solutions 勉強会 / How to select G...

NVIDIA Robotics Solutions 勉強会 / How to select GPUs for your Physical AI workloads on AWS

2026.4.14 開催の Physical AI on AWS 勉強会 #2 のスライド資料です。

Avatar for Tohoko Sugiyama

Tohoko Sugiyama

April 21, 2026

Other Decks in Technology

Transcript

  1. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Physical AI on AWS AWS サービスの選択肢 Tohoko Sugiyama, Ph.D. フ ィ ジ カ ル A I 開 発 ⽀ 援 プ ロ グ ラ ム b y A W S ジ ャ パ ン N V I D I A R o b o t i c s S o l u t i o n s 勉 強 会 Associate Solutions Architect Amazon Web Services Japan, G.K.
  2. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. © 2026, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Confidential and Trademark. 2 アジェンダ • Physical AI 開発サイクルにおける EC2 インスタンスの選択肢 • データの⽣成ステップでの AWS 活⽤ • RADS のご紹介
  3. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Physical AI 開発サイクルにおける EC2 インスタンスの選択肢 3
  4. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 4 モデル配信 Physical AI の開発 ステップ と サイクル データの ⽣成や収集 モデルの学習 モデルの 配信や推論 開発ステップ
  5. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 実世界 物理ロボット データの⽣成や収集 モデルの学習 モデルの配信や推論 Amazon EC2 g6e.2xlarge ファイルシステム クラスタ環境 AWS ParallelCluster 5 データ ストア Amazon S3 Amazon FSx for Lustre Amazon SageMaker HyperPod or AWS IoT Greengrass リモートデスクトップ環境 データ⽣成 / シミュレーター環境 クラウド推論環境 Amazon EC2 g6.large モデル配信 Physical AI on AWS の リファレンスアーキテクチャ Amazon DCV NVIDIA Isaac Sim / Lab モデル配信 推論 構成要素 開発ステップ オフライン学習 オンライン学習 推論
  6. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. フェーズ別 推奨 AWS インスタンス フェーズ GPU 推奨インスタンス データ前処理 なし (CPU) / L4 C8i / M8i / G6.xlarge シミュレーション L40S / RTX PRO 6000 Blackwell G6e / G7e.2xlarge 学習(LoRA FT) L40S (48GB) G6e.2xlarge ~ 8xlarge 学習(フル FT) H100 (80GB) P5.4xlarge 事前学習 H200 (141GB) / B200 (180 GB) P5en / P6-B200.48xlarge 推論(テスト⽤) L4 (24GB) G6.xlarge 6
  7. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Amazon EC2 とは 7 必要なときに必要な計算リソースを確保可能な仮想サーバサービス ※ ⼀部タイプについては1時間単位 • 数分で起動し、秒単位※ の従量課⾦で利⽤可能 • ワークロードに応じて 様々なインスタンスタイプを選択可能 • 50 以上のインスタンスファミリー • 1000 以上のインスタンスタイプ • OSは Windows Server や Mac、Red Hat Enterprise Linux も選択可能 (ライセンス費⽤込み) Host Server Hypervisor Guest 1 Guest 2 Guest n EC2インスタンス
  8. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 命名規則を覚えて、名前からインスタンスの特徴を知ろう EC2 インスタンスの命名規則 シリーズ名 G6e.2xlarge シリーズ 世代 オプション サイズ g Graphics Intensive p Performance (GPU accelerated) c Compute Optimized m General purpose(汎⽤) オプション i Intel プロセッサ e Extra (追加の GPU メモリ) n Network と EBS の最適化 AWS ドキュメント︓Amazon EC2 インスタンスタイプの命名規則 https://docs.aws.amazon.com/ja_jp/ec2/latest/instancetypes/instance-type-names.html 8
  9. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. ワークロードに応じて、様々な GPU 搭載インスタンスを⽤意 NVIDIA GPU を搭載した G 系、P 系インスタンス インスタンス ファミリー GPU VRAM RT コア 主な⽤途 G6 L4 24 GB ◯ 第3世代 推論・軽量グラフィックス G6e L40S 48 GB ◯ 第3世代 中規模モデルの学習・ 空間コンピューティング G7e RTX PRO 6000 Blackwell 96 GB ◯ 第4世代 中規模モデルの学習・ 空間コンピューティング P5 H100 80 GB × ⼤規模分散学習 9
  10. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. トレーニング 向き 推論向き グラフィックス 機械学習 ワークロードに応じて、様々な GPU 搭載インスタンスを⽤意 NVIDIA GPU を搭載したインスタンスラインナップ 10 P6- B200 NVIDIA B200 Tensor Core GPU P6e- GB200 NVIDIA GB200 NVL72 P5 (-/e/en) NVIDIA H100/H200 GPU P4 (d/de) NVIDIA A100 GPU P6e- GB300 NVIDIA GB300 NVL72 P6- B300 NVIDIA B300 Tensor Core GPU G6e NVIDIA L40S GPU G6 NVIDIA L4 GPU G6e NVIDIA L40S GPU G6 NVIDIA L4 GPU G5 NVIDIA A10G GPU G4dn NVIDIA T4 GPU 10 G7e NVIDIA RTX 6000 PRO Blackwell
  11. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. フェーズごとに適切なインスタンスを利⽤して、コストとパフォーマンス効率を最⼤化しよう フェーズ別 推奨 AWS インスタンス フェーズ GPU 推奨インスタンス ポイント データ前処理 なし / L4 C8i / M8i / G6.xlarge CPU 中⼼の処理、 GPU は必須ではない シミュレーション L40S / RTX PRO 6000 Blackwell G6e / G7e.2xlarge RT コア + ⼤容量 VRAM でリアルタイム レンダリング 学習(LoRA FT) L40S (48GB) G6e.2xlarge ~ 8xlarge 少ないパラメタ更新で VRAM 消費が軽め 学習(フル FT) H100 (80GB) P5.4xlarge ⼤容量 VRAM が必須 事前学習 H200 (141GB) / B200 (180 GB) P5en / P6- B200.48xlarge 8 GPU 構成の インスタンスを選択 推論(テスト⽤) L4 (24GB) G6.xlarge 重みのロードのみ、 最⼩限の VRAM で OK 11
  12. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 合成データ⽣成からモデル学習まで、6 ステージを G 系、P 系混合 GPU クラスタで⾃動実⾏ NVIDIA OSMO on AWS で Physical AI パイプラインの⾃動化 1. シーン セットアップ 2. 占有マップ ⽣成 3. 軌道⽣成 4. レンダリング G 系 GPU 5. ドメイン拡張 G 系 GPU 6. モデル学習 P 系 GPU • Terraform テンプレートで Amazon EKS クラスタを構築 • Karpenter で G 系ノード(レンダリング⽤)と P 系ノード(学習⽤)を動的にプロビジョ ニング • ステージ間のデータは Amazon S3 で受け渡し • KAI Scheduler が GPU リソースを効率的にスケジューリング 参考 URL: - OSMO 本体: github.com/NVIDIA/OSMO - AWS サンプル: github.com/awslabs/awsome-distributed-training (PR #1018) - AWS インフラ Terraform: github.com/NVIDIA/OSMO/tree/main/deployments/terraform/aws/example 12
  13. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. データ⽣成ステップでの AWS 活⽤ 13
  14. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 14 Physical AI の開発 ステップ と サイクル データの ⽣成や収集 モデルの学習 モデルの 配信や推論
  15. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. 実世界 物理ロボット データの⽣成や収集 Amazon EC2 g6e.2xlarge 15 データ ストア Amazon S3 リモートデスクトップ環境 データ⽣成 / シミュレーター環境 データの ⽣成 や 収集 Amazon DCV NVIDIA Isaac Sim / Lab 構成要素 開発ステップ
  16. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS 上 Isaac Sim 実⾏環境の構成図 16 オフィス AWS Cloud Public subnet VPC Amazon S3 Laptop ユーザー Amazon EC2 Amazon DCV インターネット
  17. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 17 オフィス AWS Cloud(東京リージョン) Public subnet VPC Amazon S3 Laptop ユーザー Amazon EC2 Amazon DCV インターネット 東京リージョンを利⽤することで、 より低遅延な操作感を実現 (G6e, G7e は東京リージョン対応) AWS 上 Isaac Sim 実⾏環境の構成図
  18. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS 上 Issac Sim 実⾏環境の構成図 18 オフィス AWS Cloud(東京リージョン) Public subnet VPC Amazon S3 Laptop ユーザー Amazon EC2 Amazon DCV インターネット Amazon EC2 GPU インスタンス (例︓G6e.xlarge) Amazon DCV Server Isaac Sim NVIDIA Driver + CUDA + Omniverse NVIDIA のマシンイメージを 利⽤することで、 EC2 起動時に必要なツールの インストールが完了する
  19. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. AWS 上 Issac Sim 実⾏環境の構成図 19 オフィス AWS Cloud(東京リージョン) Public subnet VPC Amazon S3 Laptop ユーザー Amazon EC2 Amazon DCV インターネット ⾼性能リモートデスクトッププロトコル • EC2 上の GPU アプリをリモートストリーミング • EC2 上なら追加料⾦なし • Web ブラウザからも接続可能 • GPU ハードウェアエンコーダー(NVENC)使⽤し、CPU 負荷が低い Amazon DCV
  20. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved. Remote AWS Develop Station (RADS) Physical AI 開発に便利な EC2ベースの開発環境を 簡単に起動/接続/管理できるサンプルの紹介 Yuhei Harada フ ィ ジ カ ル A I 開 発 ⽀ 援 プ ロ グ ラ ム b y A W S ジ ャ パ ン N V I D I A R o b o t i c s S o l u t i o n s 勉 強 会 Solutions Architect Amazon Web Services Japan, G.K.
  21. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. Remote AWS Develop Station (RADS) 21 • EC2ベースの開発環境をWebポータル経由で提供する サンプルソリューション • 下記の⽅法による接続をサポート • Amazon DCVによるリモートデスクトップ接続 (Webブラウザおよびネイティブクライアント) • code-server(ブラウザIDE) • SSH接続 (AWS Systems Managerによるポート フォワーディング) • Physical AI 開発やAI駆動開発がすぐに始められる ゴールデンイメージを簡単にセットアップ • セルフサービスで環境の作成/起動/停⽌/削除が可能 • AWS CDK (Cloud Development Kit)により数コマン ドでデプロイ、利⽤が可能
  22. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 22 Walkthrough
  23. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 23 Use Case 1: Isaac SimおよびROS2によるPhysical AI開発 • Robotics開発に必要なツールチェーンが 構成済みの環境にワンクリックで接続 環境のセットアップが不要 • Amazon DCV リモートデスクトップで GPU環境に接続 • ローカルPCのスペックやOSに依存せずク ラウド上のGPU環境で開発が可能 • 環境の作成・起動・停⽌はセルフサービ スで実⾏、チームメンバーごとに独⽴し た環境を利⽤可能 構成済み環境 (要件に応じてカスタム可能) • Ubuntu 24.04 LTS + Ubuntu Desktop (GNOME) + NVIDIA GRID ドライバー • NVIDIA Isaac Sim 5.1.0 • ROS2 Jazzy
  24. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 24 Use Case 2: Claude Code on Bedrock/Kiro CLIによるAI駆動開発 • Claude Code on BedrockおよびKiro CLI がセットアップ済み、接続後すぐに Coding Agentを利⽤した開発が可能 • (Claude Code on BedrockはIAM ロール設定済みで、追加の認証設定は 不要) • ローカル環境から分離された使い捨て可能 な独⽴環境のため、エージェントに実⾏判 断を委ねた⾃律的な開発が可能 • ⻑時間のタスクや複数エージェントの並列 実⾏など、ローカルでは難しいワークロー ドをクラウド上で継続 • 環境ごとに独⽴しており、不要になれば削 除・再作成が容易
  25. © 2026, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Amazon Confidential and Trademark. 25 利⽤⽅法 セットアップ ご利⽤にあたって Step1: CDKデプロイ Step2: AMIビルド cdk deploy –all ./scripts/build-ami.sh –wait all • 現在、オープンソースでの公開に向けて準備中です • ご興味のある⽅は AWSアカウントチームまでお気軽にお問い合わせください • 本ソリューションはサンプルコードとして開発中です。ご利⽤の際は各組織のセキュリティ要件に応じた レビューを実施の上ご利⽤ください Web ポータル、認証基盤、DCV 接続基盤など管理インフラを⼀括 デプロイ 開発ツール構成済みのゴールデンイメージ を構築、完了後すぐに環境の作成が可能
  26. © 2025, Amazon Web Services, Inc. or its affiliates. All

    rights reserved. Thank you! © 2025, Amazon Web Services, Inc. or its affiliates. All rights reserved.