Slide 9
Slide 9 text
例: Llama2 の必要計算リソース
● Meta が 2023/07 に公開した大規模言語モデル
● パラメーター規模に比例して計算量が大きくなる
9
学習時間 (A100 GPU hours) 日換算(A100 単体) 日換算(A100 x8*)
Llama2 70B 1,720,320 71,680 8,960
Llama2 13B 368,640 15,360 1,920
Llama2 7B 184,320 7,680 960
https://github.com/facebookresearch/llama/blob/main/MODEL_CARD.md
* NVIDIA DGX A100 640GB に乗っている GPU の基数