MongoDB Vectorsearchではじめるカスタマイズ可能な生成AIアプリ開発

MongoDB Vectorsearchではじめるカスタマイズ可能な生成AIアプリ開発林田千瑛 MongoDB Singapore ソリューションアーキテクト WELCOME

自己紹介林田千瑛 MongoDB のソリューションアーキテクトインフラエンジニア→ソフトウェアエンジニア→ソリューションアーキテクト Web企業にてデータ基盤・機械学習基盤・検索サービス開発に従事した後、クラウドベンダのソリューションアーキテクトを経て 2023年11月からMongoDBに入社

生成AIにより変わる社会 $4.4兆生成AIが1年に生み出す経済利益の予想 60-70% 生成AIによって自動化されると予想される作業 Source: McKinsey GenAI
report

大規模言語モデル（LLM）でできること ◦ ◦ 文章生成: 小説、記事、ブログ投稿の自動作成 ◦ 要約: 長文の要約やポイント抽出 ◦ 翻訳:
多言語間の自動翻訳 ◦ 対話: カスタマサポートやチャットボットの構築 ◦ クリエイティブライティング: ストーリーやキャラクターのアイデア生成 ◦ 広告コピー: マーケティングや広告文の生成 ◦ 音楽の歌詞作成: 歌詞の自動生成やアイデア提供 ◦ 情報抽出: テキストから特定の情報を自動抽出 ◦ 質問応答: 自然言語の質問に対する正確な応答 ◦ データ解析: テキストデータの分析やパターン認識 ◦ 専門知識の提供: 医療、法律、技術分野などの専門知識に基づく回答 ◦ 教育支援: 教材の作成や学生の質問への応答 ◦ プログラムの自動生成・チェック自然言語理解と生成情報の整理と検索クリエイティブな応用専門知識の活用

大規模言語モデル（LLM）でできること ◦ ◦ 文章生成: 小説、記事、ブログ投稿の自動作成 ◦ 要約: 長文の要約やポイント抽出 ◦ 翻訳:
多言語間の自動翻訳 ◦ 対話: カスタマサポートやチャットボットの構築 ◦ クリエイティブライティング: ストーリーやキャラクターのアイデア生成 ◦ 広告コピー: マーケティングや広告文の生成 ◦ 音楽の歌詞作成: 歌詞の自動生成やアイデア提供 ◦ 情報抽出: テキストから特定の情報を自動抽出 ◦ 質問応答: 自然言語の質問に対する正確な応答 ◦ データ解析: テキストデータの分析やパターン認識 ◦ 専門知識の提供: 医療、法律、技術分野などの専門知識に基づく回答 ◦ 教育支援: 教材の作成や学生の質問への応答 ◦ プログラムの自動生成・チェック自然言語理解と生成情報の整理と検索クリエイティブな応用専門知識の活用全ての業種・職種において生成AI活用の機会が存在する

CoachGTM：MongoDB社内で利用されるLLMによるリアルタイム技術サポートチャットボット • LLM と MongoDB Atlas Vector Search により実装
• セールスやカスタマーサクセスのメンバの迅速な顧客サポートのために利用

臨床試験報告書の自動生成により、新薬承認のプロセスを劇的に高速化 • 170カ国で薬を販売する年商335億ドルの製薬企業 • MongoDB Atlas と Amazon
BedRock を利用した生成AIシステム顧客の声「MongoDB Atlas の優れた点は、レポートのネイティブベクトル埋め込みを、関連するテキストスニペットやメタデータのすべてと並べて保存できることです」「非常に強力で複雑なクエリを迅速に実行できるのです。ベクトル埋め込みごとに、どのソースドキュメントから取得したか、誰がいつ作成したかに基づいてフィルター処理できます。」臨床試験報告書(CSR)の例

なぜLLM（素のChatGPT等）ではだめなのか LLMモデルの学習データに含まれない内容について答えられない • 「今日の天気」などのリアルタイムな情報、ドメイン固有のデータに基づく質疑応答ができない • 信頼性の低いデータに基づく回答が行われる場合がある • それっぽい嘘情報を答えてしまう（Hallucination） Retrieval
Augmented Generation (RAG) LLMモデルのコンテキスト不足による問題を情報検索技術との融合により解決

LLMによる質問応答ユーザ質問（プロンプト）生成された回答ユーザXが7月11日に注文した内容を教えてすみません、わかりません LLM プロバイダ
Amazon Bedrock

RAGによる質問応答 LLM プロバイダ Amazon Bedrock ユーザXは7/20に牛タン 5個とレバ刺し3つを注文しました質問ユーザXの7月20日の注文内容を教えて
関連文書ユーザX 7/20注文牛タン5個、レバ刺し3つユーザXの7月20日の注文内容を教えて注文情報のベクトルデータベースユーザ質問（プロンプト）生成された回答

インデックスベクトルデータベースとは Embedding モデル OpenAI, Cohere, Anthropic, HuggingFace, Vertex AI,
Amazon Bedrock などドキュメント画像音声動画 [0.4 0.7 0.9 … [0.2 0.3 0.8 … [0.1 0.6, 0.3 … [0.5 0.1 0.2 . . . [0.7 0.3 0.2 … [0.45 0.15 0.8 … ベクトルベクトルデータベース • データの特徴を数値の配列（ベクトル）として保存するデータベース • ベクトルの作成にはLLMとは別の「Embeddingモデル」というタイプの機械学習モデルを利用する

関連文書の抽出方法：ベクトル検索ユーザID 文書種別日付 [0.3, 0.4, 0.2, 0.1…] 数字の配列で示されるベクトル
データを数値配列で表し、距離の近いものを類似データとして抽出するベクトルデータの例

関連文書の抽出方法：ベクトル検索ユーザID 文書種別日付ユーザX 7/20注文牛タン 5個、レバ刺し3つプロンプト：ユーザXの7月20日の注文内容を教えて最も距離の近いものN個を
抽出して関連文書として利用

RAG以外にも広がるベクトル検索のユースケースマルチメディア検索画像、音声、動画等の非構造化データをベクトル化して、その類似度により検索するセマンティック検索ドキュメント検索において、キーワードが合致せずとも内容が似ている文書を検索する
異常検知データの中で他データと類似しないデータを抽出する

MongoDB Atlas Vector Search: Retool 社の生成AIサーベイにて2年連続で最も顧客満足度の高いベクトルデータベース Linked データベース種別ごとのトレンドの移り変わりベクトルデータベース
MongoDB 事例数顧客満足度圧倒的 No.1! Retool社のレポート MongoDB は DB Ranking 5位

ベクトルデータベースに求められる要件 •簡単にスモールスタート可能 ◦ ラーニングコストが少ない ◦ 簡単にアプリに組み込み ◦ ノーコスト/ローコストではじめられる ◦ インフラ管理不要
•複雑なクエリ要件に対応 ◦ あらゆるデータをベクトルデータと一緒に保存可能 ◦ 複雑なDBクエリとベクトル検索を組み合わせ可能 ◦ ベクトルデータの二重持ち、上書きなどのアプリ仕様の変更に柔軟に対応可能 •LLMアプリへの組み込み容易性 ◦ クラウドサービスとのコラボレーション ◦ LLMアプリ開発フレームワークとの統合 ◦ アプリコードの自動生成 •スケーラブル・低レイテンシ ◦ 大量アクセス・大量データに対応できる ◦ アクセス急増に応じてスケールできる ◦ 低レイテンシ •エンタープライズレベルのセキュリティ ◦ VPC Peering/IPアクセス制御 ◦ 暗号化 ◦ 認証・認可 ◦ 監査ログモニタリング/アラート

ベクトルデータベースに求められる要件 - 簡単にスモールスタート可能クエリ作成画面インデックス作成画面

ベクトルデータベースに求められる要件 - 簡単にスモールスタート可能クエリ作成画面インデックス作成画面フルマネージドクエリがJSONなのでSQL が苦手なMLエンジニアも簡単に習得可能無料の
Shared Cluster でも 3つまでインデックス作成可能 GUIのみでクラスタ作成、DB作成、データ挿入、インデックス設定、クエリ作成が可能

Vector Search GEN AI powered APP LLM Prompt Context Orchestration
Layer Single View _id: ObjectID(‘62f13a3fe7321ca47aecb216’) symbol: “ABMD” quarter: 4 year: 2021 Date: 2021-04-29T20:10:40.000+00:00 Content: “Operator: Ladies and gentleman, thank you for standing by, and welcome…” Content_embeddings: Array 0: 0.03898080065846443 1: -0.05879044905304909 2: 0.04323239979442215 3: -0.021337900310754776 4: -0.036346953362226486 5: 0.028689613565802574 6: -0.03514527902007103 7: -0.07414846867322922 8: -0.00993054173886776 9: 0.007234036456793547 10: -0.03197460621595383 ドキュメントに格納される埋め込みベクトルの例ベクトル埋め込み

ベクトルデータベースに求められる要件 - 複雑なクエリ要件に対応 db.embedded_movies.aggregate([ {"$vectorSearch": { "index": "rrf-vector-search", "path": "plot_embedding",
"queryVector": [-0.0105516575,-0.014830452,...], "numCandidates": 100, "limit": 20}}, {"$project": { "vs_score": 1,"_id": "$docs._id","title": "$docs.title"} {"$unionWith": { "coll": "movies","pipeline": [ {"$search": { "index": "rrf-full-text-search", "phrase": {"query": "new york","path": "title"}}},{ "$project": { "fts_score": 1, "_id": "$docs._id", "title": "$docs.title"}]}}, {"$group": { "_id": "$title", "vs_score": {"$max": "$vs_score"}, "fts_score": {"$max": "$fts_score"}}}, {"$project": { "_id": 1,"title": 1, "vs_score": {"$ifNull": ["$vs_score", 0]}, "fts_score": {"$ifNull": ["$fts_score", 0]}}}, {"$sort": {"score": -1}}, {"$limit": 10} ]) ベクトル検索全文検索 DBクエリ

ベクトルデータベースに求められる要件 - 複雑なクエリ要件に対応 db.embedded_movies.aggregate([ {"$vectorSearch": { "index": "rrf-vector-search", "path": "plot_embedding",
"queryVector": [-0.0105516575,-0.014830452,...], "numCandidates": 100, "limit": 20}}, {"$project": { "vs_score": 1,"_id": "$docs._id","title": "$docs.title"} {"$unionWith": { "coll": "movies","pipeline": [ {"$search": { "index": "rrf-full-text-search", "phrase": {"query": "new york","path": "title"}}},{ "$project": { "fts_score": 1, "_id": "$docs._id", "title": "$docs.title"}]}}, {"$group": { "_id": "$title", "vs_score": {"$max": "$vs_score"}, "fts_score": {"$max": "$fts_score"}}}, {"$project": { "_id": 1,"title": 1, "vs_score": {"$ifNull": ["$vs_score", 0]}, "fts_score": {"$ifNull": ["$fts_score", 0]}}}, {"$sort": {"score": -1}}, {"$limit": 10} ]) 長文テキスト、非構造データ、複雑な半構造化データなどを格納可能な多様なスキーマアプリ側の変更に簡単に追従可能なデータモデル単独クエリでDBクエリ、全文検索、ベクトル検索クエリを実現可能なクエリ言語とインデックス ACIDトランザクション

ベクトルデータベースに求められる要件 - LLMアプリへの組み込み容易性 Atlas ベクトル検索 Pre Filter Post Filter 全文検索
ハイブリッド検索クラウドサービス生成AIアプリ開発フレームワーク Amazon Bedrock, Google Vertex AI, Azure Semantic Kernel によるネイティブサポート Langchain や LlamaIndex との統合 GitHub Copilot や Amazon Q によるクエリ自動生成アプリコード生成ネイティブサポート

ベクトルデータベースに求められる要件 - スケーラブル・低レイテンシ ✓ 水平スケールで巨大データにも対応 ✓ 急なアクセスに対応可能なオートスケール ✓ DBクエリはミリ秒単位で応答可能 (ベクトル検索のベンチマークはないが、競合との比較検証
で高速なケースが複数あり) MongoDB のスケーラビリティに関しては 7/12 の A12 セッション「MongoDB Atlas：モダンなアプリ開発を支えるデータプラットフォームのご紹介」もご視聴ください！ ✓ 検索専用ノードによるワークロード分離

堅牢なセキュリティ機能 Business Trust Needs Security Features Authentication SCRAM, X.509, LDAPS,
AWS IAM, IP Access Lists, Workload Identity Federation(New!) Authorization RBAC, Read-Only Views, Field-Level Redaction Auditing Admin, DML, DDL, DCL, Role-based Encryption 転送中データの暗号化(In-flight): TLS 1.2+ 保存データの暗号化(at-rest): ハードウェア暗号化, ボリュームやデータベースストレージの暗号化 (AES-256) 暗号化キー: Client-Side Field Level Encryption, クラウドサービスのKMS (AWS KMS, Azure KV, Google Cloud KMS) Queryable Encryption(New!) • すべての MongoDB Atlas プロジェクトは顧客自身のVPCネットワーク上にデプロイすることができ、ネットワークは外部から分離される。 • 3つのクラウド（AWS, GCP, Azure）上でVPC Peering、Private Endpoint を利用可能

ベクトルデータベースの機能比較ベクトル専用データベースリレーショナルデータベースキーバリューストア検索エンジン分析データベース
MongoDB Atlas フルマネージドサービスがあるリッチなGUIクエリエディタ (マウス操作のみでデータ挿入・クエリ実行可能) リッチなクエリとインデックスデータモデルの柔軟性 ~ ACIDトランザクション水平スケール ~ オートスケール ~ ~ ~ レイテンシ・リアルタイムデータの使用 ~ セキュリティ機能の豊富さ (限定的な場合が多い) (限定的な場合が多い) (可能なものもあるが限定的) (可能なものもあるが限定的) (元データソースと挿入タイミングがずれる) (まだエンタープライズレティでない) (可能なものもあるが限定的)

ベクトルデータベースの要件とMongoDB の機能まとめ •簡単にスモールスタート可能 ◦ クエリがJSON形式のためSQLが苦手なアプリ/ML エンジニアにも使いやすい ◦ GUIのみでクラスタ作成、DB作成、データ挿入、インデックス設定、クエリ作成が可能 ◦
無料のShared Clusterで簡単に機能を試せる ◦ フルマネージドサービス •複雑なクエリ要件に対応 ◦ 長文テキスト、非構造データ、複雑な半構造化データなどを格納可能な多様なスキーマ ◦ アプリ側の変更に簡単に追従可能なデータモデル ◦ 単独クエリでDBクエリ、全文検索、ベクトル検索クエリを実現可能なクエリ言語とインデックス ◦ ACIDトランザクション •LLMアプリへの組み込み容易性 ◦ Amazon Bedrock, Google Vertex AI, Azure Semantic Kernel によるネイティブサポート ◦ Langchain や LlamaIndex との統合 ◦ GitHub Copilot や Amazon Q によるクエリ自動生成 • スケーラブル・低レイテンシ ◦ 水平スケールで巨大データにも対応 ◦ 急なアクセスに対応可能なオートスケール ◦ 検索専用ノードによるワークロード分離 ◦ DBクエリはミリ秒単位で応答可能 (ベクトル検索のベンチマークはないが、競合との比較検証で高速なケースが複数あり) • エンタープライズレベルのセキュリティ ◦ VPC Peering/IPアクセス制御 ◦ 暗号化(In flight, At rest, Queryable Encryption) ◦ 認証・認可(プロジェクト/クラスタ/DB/コレクションレベル) ◦ 監査ログモニタリング/アラート

Atlas Vectorsearchを利用したRAGアプリのフロー User Atlas Function Embedding モデル User Embedding モデル
LLMモデルベクトルデータの挿入 Q&Aクエリベクトルデータの挿入ドキュメントの挿入トリガーでEmbedding API起動回答質問をベクトル化して関連文書検索質問と関連文書をLLMにインプット

任意のRAGアプリデプロイを支援するパートナーエコシステム https://www.mongodb.com/blog/post/building-gen-ai-mongodb-ai-partners-june-2024 • RAGアプリのデプロイを簡素化する複数のパートナー • テンプレートを選んで数クリックでデプロイし、自由にカスタマイズ

MongoDB Atlasの機能は、期限なし無料の M0 クラスタで簡単にお試しいただけます ※本番環境としては、課金が必要なM10以上の利用をおすすめします ※ M0クラスタでは、データサイズやインデックス数などの機能制限があります

Q&A ご質問がありましたら、どうぞブースにきてお気軽にお声がけください！フィードバック QRコードをスキャンして、セッションアンケートにご協力ください。ご清聴ありがとうございました

MongoDB Vectorsearchではじめるカスタマイズ可能な生成AIアプリ開発

MongoDB Vectorsearchではじめるカスタマイズ可能な生成AIアプリ開発

chie8842

More Decks by chie8842

Other Decks in Technology

Featured

Transcript

MongoDB Vectorsearchではじめるカスタマイズ可能な生成AIアプリ開発林田千瑛 MongoDB Singapore ソリューションアーキテクト WELCOME

生成AIにより変わる社会 $4.4兆生成AIが1年に生み出す経済利益の予想 60-70% 生成AIによって自動化されると予想される作業 Source: McKinsey GenAI

大規模言語モデル（LLM）でできること ◦ ◦ 文章生成: 小説、記事、ブログ投稿の自動作成 ◦ 要約: 長文の要約やポイント抽出 ◦ 翻訳:

大規模言語モデル（LLM）でできること ◦ ◦ 文章生成: 小説、記事、ブログ投稿の自動作成 ◦ 要約: 長文の要約やポイント抽出 ◦ 翻訳:

CoachGTM：MongoDB社内で利用されるLLMによるリアルタイム技術サポートチャットボット • LLM と MongoDB Atlas Vector Search により実装

臨床試験報告書の自動生成により、新薬承認のプロセスを劇的に高速化 • 170カ国で薬を販売する年商335億ドルの製薬企業 • MongoDB Atlas と Amazon

LLMによる質問応答ユーザ質問（プロンプト）生成された回答ユーザXが7月11日に注文した内容を教えてすみません、わかりません LLM プロバイダ

RAGによる質問応答 LLM プロバイダ Amazon Bedrock ユーザXは7/20に牛タン 5個とレバ刺し3つを注文しました質問ユーザXの7月20日の注文内容を教えて

インデックスベクトルデータベースとは Embedding モデル OpenAI, Cohere, Anthropic, HuggingFace, Vertex AI,

関連文書の抽出方法：ベクトル検索ユーザID 文書種別日付 [0.3, 0.4, 0.2, 0.1…] 数字の配列で示されるベクトル

関連文書の抽出方法：ベクトル検索ユーザID 文書種別日付ユーザX 7/20注文牛タン 5個、レバ刺し3つプロンプト：ユーザXの7月20日の注文内容を教えて最も距離の近いものN個を

MongoDB Atlas Vector Search: Retool 社の生成AIサーベイにて2年連続で最も顧客満足度の高いベクトルデータベース Linked データベース種別ごとのトレンドの移り変わりベクトルデータベース

ベクトルデータベースに求められる要件 •簡単にスモールスタート可能 ◦ ラーニングコストが少ない ◦ 簡単にアプリに組み込み ◦ ノーコスト/ローコストではじめられる ◦ インフラ管理不要

ベクトルデータベースに求められる要件 •簡単にスモールスタート可能 ◦ ラーニングコストが少ない ◦ 簡単にアプリに組み込み ◦ ノーコスト/ローコストではじめられる ◦ インフラ管理不要

ベクトルデータベースに求められる要件 - 簡単にスモールスタート可能クエリ作成画面インデックス作成画面

ベクトルデータベースに求められる要件 - 簡単にスモールスタート可能クエリ作成画面インデックス作成画面フルマネージドクエリがJSONなのでSQL が苦手なMLエンジニアも簡単に習得可能無料の

ベクトルデータベースに求められる要件 •簡単にスモールスタート可能 ◦ ラーニングコストが少ない ◦ 簡単にアプリに組み込み ◦ ノーコスト/ローコストではじめられる ◦ インフラ管理不要

Vector Search GEN AI powered APP LLM Prompt Context Orchestration

ベクトルデータベースに求められる要件 - 複雑なクエリ要件に対応 db.embedded_movies.aggregate([ {"$vectorSearch": { "index": "rrf-vector-search", "path": "plot_embedding",

ベクトルデータベースに求められる要件 - 複雑なクエリ要件に対応 db.embedded_movies.aggregate([ {"$vectorSearch": { "index": "rrf-vector-search", "path": "plot_embedding",

ベクトルデータベースに求められる要件 •簡単にスモールスタート可能 ◦ ラーニングコストが少ない ◦ 簡単にアプリに組み込み ◦ ノーコスト/ローコストではじめられる ◦ インフラ管理不要

ベクトルデータベースに求められる要件 - LLMアプリへの組み込み容易性 Atlas ベクトル検索 Pre Filter Post Filter 全文検索

ベクトルデータベースに求められる要件 •簡単にスモールスタート可能 ◦ ラーニングコストが少ない ◦ 簡単にアプリに組み込み ◦ ノーコスト/ローコストではじめられる ◦ インフラ管理不要

ベクトルデータベースに求められる要件 •簡単にスモールスタート可能 ◦ ラーニングコストが少ない ◦ 簡単にアプリに組み込み ◦ ノーコスト/ローコストではじめられる ◦ インフラ管理不要

堅牢なセキュリティ機能 Business Trust Needs Security Features Authentication SCRAM, X.509, LDAPS,

ベクトルデータベースの機能比較ベクトル専用データベースリレーショナルデータベースキーバリューストア検索エンジン分析データベース

Atlas Vectorsearchを利用したRAGアプリのフロー User Atlas Function Embedding モデル User Embedding モデル

Q&A ご質問がありましたら、どうぞブースにきてお気軽にお声がけください！フィードバック QRコードをスキャンして、セッションアンケートにご協力ください。ご清聴ありがとうございました