Slide 6
Slide 6 text
5
DeepSeekの歴史の振り返り
DeepSeekの歴史
2025年
1月
2024年
12月
2024年
5月
2023年
11月
2023年
5月
DeepSeek-V3
DeepSeek-V2
DeepSeek-R1
Multi-head Latent
Attention
DeepSeek MoE
auxiliary-loss-free
strategy
Multi Token Prediction
DeepSeek-R1-Zero
DeepSeek社
設立
DeepSeek Coder
DeepSeek LLM
大規模学習に向けた
精度と計算効率のトレードオフ改善
大規模学習での
精度と安定性の向上
強化学習 GRPO
強化学習による
思考能力の向上と
徹底的な計算効率の改善
DeepSeekMath
DeepSeek MoE
当時の
70Bオープンモデルに追いつく
DeepSeek-V2.5
DeepSeek-Coder-V2
@asap2650
計算効率の改善と学習の安定性を突き詰めてきた歴史