@ AWS ◦ LoRAで学習させるだけでも百万円単位 • 分散並列学習の技術が重要 ◦ HPC的なインフラ + 並列技術 ◦ Turingでも⼤規模な設備投資を計画 • データセット ◦ 独⾃に⾛⾏データを6000時間取得 ◦ ⾃動運転のための⼤規模なVisual QAデータセット Wang, Guanhua, et. al. 2023. “ZeRO++: Extremely Efficient Collective Communication for Giant Model Training.” arXiv [cs.DC]. arXiv. http://arxiv.org/abs/2306.10209. DriveLMデータセット (https://github.com/OpenDriveLab/DriveLM) 7