Slide 44
Slide 44 text
안 들어가져요
• 거대 모델의 시대
– Feature 크기의 증가: ~1M
– 모델 사이즈의 증가: 320GB (GPT-3, 2020) ~ > 1TB
– 데이터 먹이기: GPUDirect Storage / Magnum IO - 초당 120GiB 이상
• “서비스가 불가능한” 딥 러닝 모델들
– 정밀도 희생, 압축, 미니모델 그 어떠한 방식을 써도 줄일 수 없는 한계 크기
✓ 예) Pathways: SOTA 0.1% 향상마다 8천만원
✓ 모델 압축 시 발생하는 정확도 하락폭
– FP64, FP32, BF16, FP8, INT4, INT2…INT2?
42