Slide 14
Slide 14 text
©2024 Databricks Inc. — All rights reserved
DBRXの特徴
データブリックスがゼロから開発したオープンLLM。オープンLLMの中でトップクラス
の精度と性能を実現し、商用利用も可能、かつ、日本語にも対応。
● 主要なオープンLLMと比べてトップクラス、また、OpenAI
GPT-3.5を超える精度
● Llama 2-70bよりも2倍速い推論性能
● 主要なオープンLLMより4倍高い学習効率
● 一般公開のオンライン・データ・ソース、 合計12T
トークンで事前学習
● カリキュラム学習 を採用し、モデル精度向上を実
現
● フルスクラッチで実装されたオリジナルなLLM(計
132Bパラメータ)
● MoE(Mixture of Experts)を採用
○ Fine-grained Sparsity (4-of-16)、Dropless
(MegaBlocks)、RoPE、GLU、QGAを実装
● Databricksの各種機能をフル活用
○ MosaicML、Lilac、MLFlow、UC、Sparkなど
● NVIDIA GPU H100 を 3,072枚使用
○ Mosaic AI Training Service にて管理
精度と性能
データと学習手法 開発環境
モデルアーキテクチャー