生成AI新年会エヌビディア合同会社周神信也さん登壇資料一部

テーマ : 「自社からみた2024年の生成AIのトレンド予測」様々なLLM実装を支えるNVIDIA NeMo ツール NVIDIA コンシューマーインターネットサービス事業本部シニアマネージャー周神
信也（ちかがみしんや）

周神信也 (ちかがみしんや）シニアマネージャーコンシューマーインターネットサービス事業本部 NVIDIA

LLMモデル構築をEnd-to-Endで支援するNVIDIA NEMO AI モデルの構築、カスタマイズ、展開を支援するツールセットデータキュレーション分散学習モデルカスタマイズ推論の高速化
ガードレール … Retrieval Augmented Generation NeMo Curator Megatron Core NeMo Aligner Triton & TensorRT-LLM NeMo Retriever NeMo Guardrails NVIDIA NeMo NVIDIA AI Enterprise ドメイン内の安全な引用応答ドメイン内クエリモデル開発エンタープライズアプリケーションの展開 NVIDIA DGX Cloud NeMo Framework NeMo Retriever NeMo Guardrails

例）用途特化型 - ChipNeMo チップデザインに特化したカスタマイズLLM • 用途 • エンジニアのアシスタントとなるチャットボット • EDAのスクリプト生成
• バグ、問題の要約と分析 • NeMo Frameworkを使用して開発 • 事前学習済みの汎用モデルを開始点に • カスタムのトークナイザ • ドメイン適応事前学習 + ドメイン特化の指示チューニング • ドメイン適応検索モデル (RAG) • NVIDIA A100 * 128で7B, 13Bの学習に1-2日程度（スクラッチ学習の場合は60-120日） https://arxiv.org/abs/2311.00176 https://blogs.nvidia.com/blog/llm-semiconductors-chip-nemo/

NVIDIA NeMo Framework AI Training Inference ✓データの収集、キュレーション ✓3D Parallelismによる分散学習 ✓最適なハイパーパラメータを見つけるための自動コンフィギュ
レータツール ✓LLMモデルのカスタマイズ手法のサポート ✓オーケストレータのサポート: SLURM, Nephele, Kubernetes ✓推論高速化のためのモデル最適化 ✓GPUを最大限活用するサービング ✓充実したサンプルコードや補助スクリプト ✓モダリティを超えたサポートの拡大 ✓LLMs: BERT >100B, T5-MoE, T5, GPT-3, Llama ✓Multi-modal: StableDiffusion, ViT, ViT-CLIP, Instruct- Pix2Pix, Imagen NVIDIA DGX SuperPODs NVIDIA DGX Cloud NVIDIA DGX Systems https://developer.nvidia.com/nemo-framework

PaLM DRAGON E5 Retrieval Augmented Generation Text Embedding Vector Database
User Data Framework for LLMs LLM Prompt Chroma Nemotron Llama-Index NVIDIA Retrieval QA Ada BM-25 Contriever GTR GTE FAISS Milvus Pinecone Redis Weaviate LangChain BLOOM Falcon LLM Llama-2 Mistral MPT Ranked Data Re-ranker or Personalize

NeMo Retriever NVIDIA NeMo Retriever - RAG • embedding reranking
personalization NVIDIA AI Foundation • • PDF • SQL Tabular • TCO • GPU • NVIDIA Enterprise Support • API • NVIDIA AI Enterprise LLM Nemo Framework Embedding Retrieval, Reranking, Personalization </> Apply for Early Access

NVIDIA Guardrails - AI サービスの健全性を制御 LLM の正確さ、的確さ、およびセキュリティを確保話題のガードレール特定のドメイン内での対話を重視安全性ガードレール
ハルシネーション、有害な情報、誤情報を防ぐセキュリティガードレール悪意のある呼び出しの実行を防ぎ、第三者アプリへの権限移譲を避ける LLM App ツールキット (例： LangChain) LLM 第三者アプリエンタープライズアプリケーション </> https://github.com/NVIDIA/NeMo-Guardrails

生成 AI 活用のための第一歩 AI NVIDIA ハードウェア、ソフトウェア、サービス NeMo Framework LLM –
PEFT – NVIDIA 技術ブログ

GTC 2024 / Japan AI Day – 開催概要名称 :
GPU Technology Conference 2024 (GTC 2024) 主催 : NVIDIA 開催日時 : 2024 年 3 月 18 日 (月) から 21 日(木) (米国時間) 開催形態 : ハイブリッド開催 (米国 San Jose Convention Center、およびオンライン) セッション数 : 650 以上のライブセッションとオンデマンドコンテンツ参加費用 : 有償 (別紙参照)。オンライン参加は無償 (一部オンラインワークショップ有償) 参加対象者 : 企業のビジネスリーダー、IT 関連の責任者や担当者、開発者、研究者、学生等 Japan AI Day : 2024 年 3 月 22 日 (金) 9:00 – 18:00 予定 (日本時間。GTC の一環としてオンライン開催) 公式サイト : www.nvidia.com/ja-jp/gtc/?ncid=GTC-NV0J4UUQ

生成AI新年会エヌビディア合同会社周神信也さん登壇資料一部

生成AI新年会エヌビディア合同会社周神信也さん登壇資料一部

HarukiFujimaki

Featured

Transcript

テーマ : 「自社からみた2024年の生成AIのトレンド予測」様々なLLM実装を支えるNVIDIA NeMo ツール NVIDIA コンシューマーインターネットサービス事業本部シニアマネージャー周神

周神信也 (ちかがみしんや）シニアマネージャーコンシューマーインターネットサービス事業本部 NVIDIA

LLMモデル構築をEnd-to-Endで支援するNVIDIA NEMO AI モデルの構築、カスタマイズ、展開を支援するツールセットデータキュレーション分散学習モデルカスタマイズ推論の高速化

例）用途特化型 - ChipNeMo チップデザインに特化したカスタマイズLLM • 用途 • エンジニアのアシスタントとなるチャットボット • EDAのスクリプト生成

NVIDIA NeMo Framework AI Training Inference ✓データの収集、キュレーション ✓3D Parallelismによる分散学習 ✓最適なハイパーパラメータを見つけるための自動コンフィギュ

PaLM DRAGON E5 Retrieval Augmented Generation Text Embedding Vector Database

NeMo Retriever NVIDIA NeMo Retriever - RAG • embedding reranking

NVIDIA Guardrails - AI サービスの健全性を制御 LLM の正確さ、的確さ、およびセキュリティを確保話題のガードレール特定のドメイン内での対話を重視安全性ガードレール

生成 AI 活用のための第一歩 AI NVIDIA ハードウェア、ソフトウェア、サービス NeMo Framework LLM –

GTC 2024 / Japan AI Day – 開催概要名称 :

生成AI新年会 エヌビディア合同会社 周神信也さん登壇資料一部

生成AI新年会 エヌビディア合同会社 周神信也さん登壇資料一部

Featured

Transcript

生成AI新年会エヌビディア合同会社周神信也さん登壇資料一部

生成AI新年会エヌビディア合同会社周神信也さん登壇資料一部