Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SambaNova Systems「SambaNova Cloud: 超高速な推論APIでAI...

Ryo Kanazawa
February 27, 2025
370

SambaNova Systems「SambaNova Cloud: 超高速な推論APIでAIエージェント開発を加速」

Ryo Kanazawa

February 27, 2025
Tweet

Transcript

  1. Copyright © 2025 SambaNova Systems Inc. 2 2 Take-Home Message

    SambaNovaで 超⾼速推論 AIエージェントを開発するなら…
  2. Copyright © 2025 SambaNova Systems Inc. 3 3 SambaNova Systems

    (サンバノバシステムズ ) 会社概要 創業者はAI業界の先駆者 ▪ 2017年、業界の第⼀⼈者らによりスタンフォー ド⼤学発のスタートアップとして設⽴ ▪ 第4世代ハードウェアから事前学習済みの基盤モ デルまで、完全に統合された⽣成AIプラット フォーム ▪ シリーズDまでに11億ドル以上の資⾦調達 Rodrigo Liang Co-founder & CEO Kunle Olukotun Co-founder & Chief Technologist & Stanford Professor Christopher Ré Co-founder & Stanford Professor プロフェッショナルな⻑期投資家からの⽀援 Lip-Bu Tan Executive Chairman
  3. 1.6 TB/s 25.6 TB/s “SN40L” RDU • TSMC 5nm テクノロジー

    + 1026億 トランジスタ + 1,040 RDUコア + 638 TFLOPS (bf16) • 3層 データフローメモリ + 520 MB オンチップメモリ (SRAM) + 64 GB 広帯域メモリ (HBM3) + 1.5 TB 大容量メモリ (DDR5) RDU — 生成AIの学習・推論に最適なアーキテクチャ Single system: SN40L-16 x 16 データフローを 大容量オンチップ メモリで実現 超低レイテンシの モデル切り替え 最大12兆個の パラメータ! RDU 大容量 DDR メモリ [24 TB] RDU 広帯域 HBM メモリ [1 TB] On-Chip SRAM [8.3 GB, PBs per sec] RDU: Reconfigurable Dataflow Unit (再構成可能データフローユニット) 4
  4. SambaNova NVIDIA Llama 3.2 1B 16-bit 2477 304 Llama 3.1

    8B 16-bit 1066 93 Llama 3.1 70B 16-bit 460 32 Llama 3.1 405B 16-bit 200 14 SambaNova による超高速な推論パフォーマンス Artificial Analysis社による推論ベンチマーク結果 (単位: token/sec/user) GPUに対して10倍以上⾼速なトークン処理速度を実現 6
  5. 量⼦化なし‧蒸留なしで世界最速! 出力スピードの比較 : DeepSeek-R1 - 出力トークン数/秒 (高いほど良い): 100入力トークン - SambaNova

    (プライベートエンドポイント): 2kコンテキストウィンドウ, リクエスト数 N=25, 2025/02/13 テスト実施 x7.6 9
  6. Copyright © 2025 SambaNova Systems Inc. 11 推論速度の重要性 速度とレイテンシは⽣成AI開発者に とって重要な評価基準である

    エージェントの構築には、多数の モデルの⾼速なリアルタイム推論が 必要 *Artificial Analysis社調べ Why?
  7. Copyright © 2025 SambaNova Systems Inc. 12 推論時間のイメージ — GPU

    vs RDU 10 秒/リクエスト ⨉ 5 LLMリクエスト = 50 秒のwall time 1 秒/リクエスト ⨉ 5 LLMリクエスト = 5 秒のwall time
  8. Copyright © 2025 SambaNova Systems Inc. 14 14 Take-Home Message

    SambaNovaで 超⾼速推論 AIエージェントを開発するなら…