Slide 38
Slide 38 text
アンロールされたコード
複数のレジスタ
v0=[zmm0, zmm1, zmm2]
un(vmulps)(z0, z0, log2_e) → vmulps(zmm0, zmm0, log2_e)
vmulps(zmm1, zmm1, log2_e)
vmulps(zmm2, zmm2, log2_e)
メモリ参照
v0=[zmm0, zmm1, zmm2]
v1=[zmm3, zmm4, zmm5]
un(vfmadd231ps)(v0, v1, ptr(rax)) → vfmadd231ps(zmm0, zmm3, ptr(rax))
vfmadd231ps(zmm1, zmm4, ptr(rax+64))
vfmadd231ps(zmm2, zmm5, ptr(rax+128))
ptrの代わりにptr_bを使うとオフセットは0のまま
38 / 58