Slide 1

Slide 1 text

2025/12/8 クラウド事業本部 コンサルティング部 ⼤村 保貴 AWS Trainium3 を ちょっと⾝近に感じたい

Slide 2

Slide 2 text

⾃⼰紹介 大村 保貴 (Yasutaka Ohmura) クラスメソッド株式会社 クラウド事業本部 コンサルティング部 ソリューションアーキテクト 出身 ● 網走市(道東、オホーツク海沿いです) ● 今年のふるさと納税に網走のホタテはいかがでしょうか 仕事 ● お客様のクラウド活用推進のための伴走支援 ● 専門はHPC(スパコン)、ライフサイエンス少々 経歴 ● オンプレITインフラの設計構築→ 自社IoTサービスの構築運用 → クラスメソッド 受賞 ● Japan AWS Top Engineers (Services) 2021, 2023 - 2025 ● Japan AWS All Certifications Engineers 2021 - 2025

Slide 3

Slide 3 text

画像引⽤: AWS re:Invent 2025 - Keynote with CEO Matt Garman

Slide 4

Slide 4 text

No content

Slide 5

Slide 5 text

Trainium(Trnインスタンス)を 機械学習や推論で使ったことある⽅ 🙋

Slide 6

Slide 6 text

Amazon Bedrock、Kiro などの AWSの⽣成AIサービスを使っている⽅ 🙋

Slide 7

Slide 7 text

GPU が溶けそう

Slide 8

Slide 8 text

8   Open AI CEO サム‧アルトマン⽒の発⾔より 引⽤: Post 2025/3/28

Slide 9

Slide 9 text

GPU が溶けている

Slide 10

Slide 10 text

No content

Slide 11

Slide 11 text

計算処理の多くは⾏列演算 ここの計算を GPU が担っている

Slide 12

Slide 12 text

なぜ GPU が必要とされているのか

Slide 13

Slide 13 text

なぜ GPU が必要とされているのか? GPU はもともとゲームや映像の描画処理を⾼速化する⽬的で発展してきました

Slide 14

Slide 14 text

なぜ GPU が機械学習に効いたのか? なぜ GPU が必要とされているのか? 似たようなこと

Slide 15

Slide 15 text

CPU

Slide 16

Slide 16 text

CPUは「何でもできる」 複雑な処理でも⾼速にさばけます

Slide 17

Slide 17 text

GPU

Slide 18

Slide 18 text

GPU は「並列計算能⼒が⾼い」 ⽐較的シンプルな処理ができるコアを⼤量に持っています

Slide 19

Slide 19 text

⾏列演算のような計算処理が中⼼の⽣成 AI のワークロードでは、 シンプルな演算を数万コアで処理する GPU が有利でした。

Slide 20

Slide 20 text

NVIDIA GB300 NVL72 が GPU インスタンスとして提供開始されました 画像引⽤: AWS re:Invent 2025 - Keynote with CEO Matt Garman

Slide 21

Slide 21 text

NVIDIA Blackwell Ultra GPU データセンター向けの GPU は AI 向けに最適化 CUDA Core が 20,480個 Tensor Coreが 640 個 画像引⽤: Inside NVIDIA Blackwell Ultra: The Chip Powering the AI Factory Era

Slide 22

Slide 22 text

Trainium

Slide 23

Slide 23 text

AWS の⾃社設計の半導体ラインナップ 画像引⽤: AWS re:Invent 2025 - AWS Trn3 UltraServers: Power next-generation enterprise AI performance(AIM3335)

Slide 24

Slide 24 text

AWS の⾃社設計の半導体 機械学習‧⽣成 AI 向けのチップとしては 2 種類

Slide 25

Slide 25 text

AWS の⾃社設計の半導体 機械学習‧⽣成 AI 向けのチップとしては 2 種類 そう思っていた時期がありました

Slide 26

Slide 26 text

画像引⽤: AWS re:Invent 2025 - Keynote with CEO Matt Garman Trainium2 は推論も現在世界最⾼レベルとのこと

Slide 27

Slide 27 text

画像引⽤: AWS re:Invent 2025 - AWS Trn3 UltraServers: Power next-generation enterprise AI performance(AIM3335)

Slide 28

Slide 28 text

AWS Trainium3 8 つのコアで、AI 向けの計算専⽤エンジンを積んでいます

Slide 29

Slide 29 text

で、いつ使うの?

Slide 30

Slide 30 text

Bedrock、Claude Code、Web アプリ、モバイルアプリの ⼤部分のトラフィックは、Trainium2 で処理されているとのこと 画像引⽤: AWS re:Invent 2025 - AWS Trn3 UltraServers: Power next-generation enterprise AI performance(AIM3335)

Slide 31

Slide 31 text

Trainium のお仕事紹介 Claude Sonnet 4.5 Opus 4.5 Haiku 4.5

Slide 32

Slide 32 text

Trainium のお仕事紹介 Kiro を使っても!

Slide 33

Slide 33 text

2024年11⽉に Amazon と Anthropic の戦略的提携 Anthropicの主要クラウドプロバイダーとしてAWSを継続 TrainiumとInferentiaを使⽤したトレーニングと展開を⾏うと発表していました

Slide 34

Slide 34 text

2025年10⽉、11⽉の発表 Google Cloud、Azure + NVIDIA も同様の取り組みをしています

Slide 35

Slide 35 text

まとめ

Slide 36

Slide 36 text

Trainium の進化は、 直接 Trn インスタンスを使わないユーザーにも恩恵があります! 現在、Claude モデルでの推論の⼤半は Trainium が処理しています

Slide 37

Slide 37 text

画像引⽤: AWS re:Invent 2025 - Keynote with CEO Matt Garman

Slide 38

Slide 38 text

参考 - https://qiita.com/Sh1ragami/items/08a8e36c9fc26695d6d6 - https://note.com/techbits/n/n841792523fb0 - https://developer.nvidia.com/blog/inside-nvidia-blackwell-ultra-the- chip-powering-the-ai-factory-era/ - https://speakerdeck.com/htokoyo/aws-innovate-aws-inferentia-train ium?slide=16

Slide 39

Slide 39 text

No content