Slide 28
Slide 28 text
© 2022, Amazon Web Services, Inc. or its affiliates.
AWS Trainium
• AWS による第2世代 独⾃設計 ML トレーニングチップ
• 2 Neuronコア / チップ
• Tensor エンジン︓畳み込み等、⾏列演算に最適化
• Scalar エンジン︓RELU等の活性化関数に最適化
• Vector エンジン︓Batch Normalizationやプーリング処理に最適化
• 組込型汎⽤DSP︓カスタムオペレータに対応
• 専⽤ collective compute エンジン
• 分散学習を⾏う際に、演算と通信をオーバーラップ
• 32GB HBM2E メモリスタック
• FP32, TF32, FP16, BF16, INT8 データタイプをサポート
• Configurable FP8、 Stochastic roundingにハードウェアで
対応
https://aws.amazon.com/machine-learning/trainium/