Slide 6
Slide 6 text
6
巨大なSIMD
行列演算回路
A x B + C
行列演算回路が 1024個あり、1つの命令で同時に動作する
MN-Core2の構造 Hot Chip 2024発表資料より
16ビット浮動小数点数の行列演算の場合
● MABひとつの行列演算回路で
512FLOP/cycle
● チップ全体で同時に
512 x 16 x 8 x 8 = 524,288 FLOP/cycle
階層構造でタイルされた巨大な演算回路
L2B: Level-2 Broadcasting Block
L1B: Level-1 Broadcasting Block
MAB: Matrix Arithmetic Block
MAU: Matrix Arithmetic Unit