Slide 25
Slide 25 text
25
低精度数値表現例: cast手法 (量子化)
block-wise (fine-grained) 量子化
-1 1 1 10
per-tensor (coarse-grained) 量子化
0 0 0 1
3値量子化
scale=10
0 0 0 10
復元
-1 1 1 10
block-wise (fine-grained) 量子化
-1 1 0 1
3値量子化, block-size=2
scale=1, 10
-1 -1 0 10
復元
一定の要素数ごとにscaleを用意する
⇒ 量子化誤差が小さくなる
4bit以下への量子化で特に重要
[ZeROQuant(4 + 2)]
Tensorごとに単一のscaleを用いる