AI アクセラレータチップ AWS Trainium/Inferentia に今こそ入門

TRAINIUM AWS re:Invent 2025 re:Cap OpsJAWS#38 2026/1/16 Yoshimi Maehara NEURON
【re:Invent �� アップデート紹介】 AI アクセラレータチップ AWS Trainium/Inferentia に今こそ入門

TRAINIUM NEURON 自己紹介前原良美（まえはらよしみ）自社サービスの UIUX 刷新や運用システム新規整備をしています。

TRAINIUM NEURON はじめに re:Invent �� - Keynote with CEO Matt
Garman Amazon Bedrock での推論の多くは Trainium によって実行されています

TRAINIUM NEURON AI チップが、今の生成 AI ブームを支えている何かのサービスに賭けるのであれば、そのサービス自体の持続可能性を見るべし裏側で動いている Trainium を知ることで、
より Amazon Bedrock や Claude に賭けられるようになる

TRAINIUM NEURON 【補足】深層学習（DeepLearning）とは人間の脳の神経細胞（ニューロン）の仕組みを利用した AI であり、大量に学習を行うことで精度の高い推論を可能にする本題に入る前に推論
未学習データ？？？学習済モデルに未学習データを投入し、回答を得る学習済モデル学習学習データケーキモデル学習データを何度も投入し、モデルの回答精度をあげる回答をもとに微修正

TRAINIUM NEURON まず、AI チップとは？深層学習（例：生成 AI モデルの構築）に必要な「膨大な量の演算処理」が高速で可能なチップ CPU start end
順番にソフトウェアの処理を実施 AI チップ start end 並列でソフトウェアの処理を実施（＝処理時間を短縮）例：GPU 例：FPGA ハードウェア記述言語（HDL）を活用（＝ソフトウェアの指示を実行するより高速） start end

TRAINIUM INFERENTIA NEURON Trainium/Inferentia とは深層学習（例：生成 AI モデルの構築）の学習・推論をする際の AI チップの選択肢
AWS Inferentia AWS Trainium NVIDIA GPU Intel Gaudi AMD GPU AMD UltraScale+ FPGA Qualcomm Cloud AI • DL�q AI チップ一覧搭載している EC� インスタンスタイプの例 • Inf� • Inf� • Trn� • Trn�n • Trn� • G�ad • G�dn • G�,G�,G�e, • P�,P� • P�,P�e • P�,P�e • F� • F� • DL�

TRAINIUM NEURON Trainium/Inferentia とは Trainium は学習に向いている AI チップ、Inferentia は推論に向いている AI
チップとして登場推論未学習データ？？？学習済モデルに未学習データを投入し、回答を得る学習済モデル学習学習データケーキモデル学習データを何度も投入し、モデルの回答精度をあげる回答をもとに微修正

TRAINIUM NEURON Trainium/Inferentia とは Trainium は推論に対しても非常に有用な AI チップであり、実際に推論で使われている

TRAINIUM NEURON Trainium とは初代 Trainium と Inferentia� は、チップのアーキテクチャ構成はほぼ一緒 https://awsdocs-neuron.readthedocs-hosted.com/en/latest/about-neuron/arch/neuron-hardware/inferentia�.html

TRAINIUM NEURON Trainium とは学習には特に強いスペックが必要なため、Trainium� にてコアやメモリ、帯域を強化 https://awsdocs-neuron.readthedocs-hosted.com/en/latest/about-neuron/arch/neuron-hardware/trainium.html

TRAINIUM NEURON Trainium とは Trainium� は業界でも高く評価され、Anthropic 社との共同プロジェクト「Project Rainier」で、数十万個が稼働（※UltraServer を用いて稼働） https://www.aboutamazon.com/news/aws/aws-project-rainier-ai-trainium-chips-compute-cluster
Claude の裏でも、Trainium� は活用されている

TRAINIUM NEURON Trainium� 搭載 UltraServer の提供開始 re:invent �� アップデート https://www.aboutamazon.com/news/aws/trainium-�-ultraserver-faster-ai-training-lower-cost
Trainium� のバージョンアップ版である Trainium� を搭載した UltraServer が登場

TRAINIUM NEURON Trainium� 搭載 UltraServer の提供開始 re:invent �� アップデート https://awsdocs-neuron.readthedocs-hosted.com/en/latest/about-neuron/arch/neuron-hardware/trainium�.html
Trainium� は Trainium� からさらにコアやメモリ、帯域をスペックアップ

TRAINIUM NEURON Trainium� 搭載 UltraServer の提供開始 re:invent �� アップデート Trainium�
搭載の UltraServer は、Trainium� 搭載の UltraServer と比べて、下記の通り • コンピューティングの性能が �.� 倍 • AI チップあたりのスループットが � 倍 • 応答時間が � 倍高速化また、Trainium� は Trainium� と比べて、エネルギー効率が ��% 向上 ⇒　利用する UltraServer を Trainium� 搭載版から Trainium� 搭載版に変更するだけで　　様々な性能があがる https://www.aboutamazon.com/news/aws/trainium-�-ultraserver-faster-ai-training-lower-cost

TRAINIUM NEURON Trainium� 搭載 UltraServer の提供開始 re:invent �� アップデート OpenAI
社の GPT-OSS モデルにて、UltraServer を Trainium� 搭載版から Trainium� 搭載版に変更するだけでトークン出力効率が � 倍に性能向上

TRAINIUM NEURON Trainium/Inferentia がなんとなくわかったところでどう使えば良いのか、気になりませんか？ EC� や SageMaker で該当インスタンスを起動後、深層学習用のソースコードを実装する必要があります。

TRAINIUM NEURON 【補足】 Pytorch とは深層学習（例：生成 AI モデルの構築）でモデルを学習・推論するときに便利な Python ライブラリ
本題に入る前に https://docs.pytorch.org/tutorials/beginner/basics/quickstart_tutorial.html モデル例：学習を開始するにあたり、まずモデルを作成

TRAINIUM NEURON Trainium が PyTorch をネイティブサポート開始 re:invent �� アップデート CPU
や GPU 上で実行できる PyTorch のソースコードを、Trainium/Inferentia 上でもそのまま利用できるように（※一箇所 cuda を neuron に変える程度で動く） https://awsdocs-neuron.readthedocs-hosted.com/en/latest/frameworks/torch/pytorch-native-overview.html

TRAINIUM NEURON さいごに他にも、オブザーバビリティツールとして Neuron Explorer や、パフォーマンス最適化のためのツールとして Neuron Kernel
Interface（NKI）が登場しました。 AI チップ開発にここまで力をいれてくれているからこそ、私たちは安心してガンガン AI を活用できます。これからも、Trainium/Infrentia を信じて、関連 AI サービスにも賭けていきましょう！

AI アクセラレータチップ AWS Trainium/Inferentia に今こそ入門

AI アクセラレータチップ AWS Trainium/Inferentia に今こそ入門

yoshimi0227

More Decks by yoshimi0227

Other Decks in Technology

Featured

Transcript

TRAINIUM AWS re:Invent 2025 re:Cap OpsJAWS#38 2026/1/16 Yoshimi Maehara NEURON

TRAINIUM NEURON 自己紹介前原良美（まえはらよしみ）自社サービスの UIUX 刷新や運用システム新規整備をしています。

TRAINIUM NEURON はじめに re:Invent �� - Keynote with CEO Matt

TRAINIUM NEURON AI チップが、今の生成 AI ブームを支えている何かのサービスに賭けるのであれば、そのサービス自体の持続可能性を見るべし裏側で動いている Trainium を知ることで、

TRAINIUM NEURON 【補足】深層学習（DeepLearning）とは人間の脳の神経細胞（ニューロン）の仕組みを利用した AI であり、大量に学習を行うことで精度の高い推論を可能にする本題に入る前に推論

TRAINIUM NEURON まず、AI チップとは？深層学習（例：生成 AI モデルの構築）に必要な「膨大な量の演算処理」が高速で可能なチップ CPU start end

TRAINIUM INFERENTIA NEURON Trainium/Inferentia とは深層学習（例：生成 AI モデルの構築）の学習・推論をする際の AI チップの選択肢

TRAINIUM NEURON Trainium/Inferentia とは Trainium は学習に向いている AI チップ、Inferentia は推論に向いている AI

TRAINIUM NEURON Trainium/Inferentia とは Trainium は推論に対しても非常に有用な AI チップであり、実際に推論で使われている

TRAINIUM NEURON Trainium とは初代 Trainium と Inferentia� は、チップのアーキテクチャ構成はほぼ一緒 https://awsdocs-neuron.readthedocs-hosted.com/en/latest/about-neuron/arch/neuron-hardware/inferentia�.html

TRAINIUM NEURON Trainium とは学習には特に強いスペックが必要なため、Trainium� にてコアやメモリ、帯域を強化 https://awsdocs-neuron.readthedocs-hosted.com/en/latest/about-neuron/arch/neuron-hardware/trainium.html

TRAINIUM NEURON Trainium� 搭載 UltraServer の提供開始 re:invent �� アップデート https://www.aboutamazon.com/news/aws/trainium-�-ultraserver-faster-ai-training-lower-cost

TRAINIUM NEURON Trainium� 搭載 UltraServer の提供開始 re:invent �� アップデート https://awsdocs-neuron.readthedocs-hosted.com/en/latest/about-neuron/arch/neuron-hardware/trainium�.html

TRAINIUM NEURON Trainium� 搭載 UltraServer の提供開始 re:invent �� アップデート Trainium�

TRAINIUM NEURON Trainium� 搭載 UltraServer の提供開始 re:invent �� アップデート OpenAI

TRAINIUM NEURON Trainium/Inferentia がなんとなくわかったところでどう使えば良いのか、気になりませんか？ EC� や SageMaker で該当インスタンスを起動後、深層学習用のソースコードを実装する必要があります。

TRAINIUM NEURON 【補足】 Pytorch とは深層学習（例：生成 AI モデルの構築）でモデルを学習・推論するときに便利な Python ライブラリ

TRAINIUM NEURON Trainium が PyTorch をネイティブサポート開始 re:invent �� アップデート CPU

TRAINIUM NEURON さいごに他にも、オブザーバビリティツールとして Neuron Explorer や、パフォーマンス最適化のためのツールとして Neuron Kernel

AI アクセラレータチップ AWS Trainium/Inferentia に 今こそ入門

AI アクセラレータチップ AWS Trainium/Inferentia に 今こそ入門

More Decks by yoshimi0227

Other Decks in Technology

Featured

Transcript

AI アクセラレータチップ AWS Trainium/Inferentia に今こそ入門

AI アクセラレータチップ AWS Trainium/Inferentia に今こそ入門