Slide 2
Slide 2 text
©2024 Databricks Inc. — All rights reserved
「DBRX」のご紹介
データブリックスがゼロから開発したオープンLLM。全ての既存オープンLLMを上回
る精度と性能を実現し、商用利用も可能、かつ、日本語にも対応。
● 主要なオープンLLMではトップ、また、OpenAI GPT-3.5
を超える精度
● LLaMa 2-70bよりも2倍速い推論性能
● 主要なオープンLLMより4倍高い学習効率
● 一般公開のオンライン・データ・ソース、 合計12T
トークンで事前学習
● カリキュラム学習 を採用し、モデル精度向上を実
現
● フルスクラッチで実装されたオリジナルなLLM(計
132Bパラメータ)
● MoE(Mixture of Experts)を採用
○ Fine-grained Sparsity (4-of-16)、Dropless
(MegaBlocks)、RoPE、GLU、QGAを実装
● Databricksの各種機能をフル活用
○ MosaicML、Lilac、MLFlow、UC、Sparkなど
● NVIDIA GPU H100 を 3,072枚使用
○ Mosaic AI Training Service にて管理
精度と性能
データと学習手法 開発環境
モデルアーキテクチャー