Slide 7
Slide 7 text
学習に必要なコスト
LLMの学習にはかなりのコストが必要。
GPUだけでなく、データセットも重要
● Llama2-70Bの学習コスト
○ 172万 GPU時間 = 10億円 @ AWS
○ LoRAで学習させるだけでも百万円単位
● 分散並列学習の技術が重要
○ HPC的なインフラ + 並列技術
○ Turingでも⼤規模な設備投資を計画
● データセット
○ 独⾃に⾛⾏データを6000時間取得
○ ⾃動運転のための⼤規模なVisual QAデータセット
Wang, Guanhua, et. al. 2023. “ZeRO++: Extremely Efficient Collective
Communication for Giant Model Training.” arXiv [cs.DC]. arXiv.
http://arxiv.org/abs/2306.10209.
DriveLMデータセット
(https://github.com/OpenDriveLab/DriveLM)
7