実践！サーバーレス RAG 構築：Firestore ベクトル検索と VertexAI LLM 活用

Slide 1

Slide 1 text

実践！サーバーレス RAG 構築：Firestore ベクトル検索と VertexAI LLM 活用頼兼孝幸グーグル・クラウド・ジャパン合同会社 Application Modernization Specialist

Slide 2

Slide 2 text

スピーカー自己紹介グーグル・クラウド・ジャパン合同会社アプリケーションモダナイゼーションスペシャリスト担当製品エリア: ● GKE ● サーバーレス（Cloud Run） ● CI/CD 最近は、生成 AI アプリ開発に触れることが増えてきました頼兼孝幸

Slide 3

Slide 3 text

サーバーレスで RAG？

Slide 4

Slide 4 text

Proprietary + Conﬁdential RAG（検索拡張生成）とは大規模言語モデル（LLM）の出力の質を向上させるための技術 ● 生成された回答の事実的正確性を向上させる ● モデルが学習していない知識へのアクセスを可能にする（グラウンディング） ● モデルが使用する知識を変更する ● モデルが情報源を引用できるようにするつまり、信頼できる専門性も理解した、最新かつ正確なデータを基に生成 AI が回答を生成するために RAG が必要となる

Slide 5

Slide 5 text

Proprietary + Conﬁdential 独自知識がない時の回答すみません、私はお店のメニューについて何も知りません。お店の名前を教えてください。 … そうじゃないんだよなぁこの店のメニューの前菜が見たい Gemini レストランにて

Slide 6

Slide 6 text

Proprietary + Conﬁdential 独自知識がある時の回答これにしようザ・クラウドキッチンのメニューの前菜は以下の通りです。 … Gemini この店のメニューの前菜が見たい店の知識レストランにて

Slide 7

Slide 7 text

データ登録の例 Storage アプリ DB LLM (e.g. Gemini) 1. upload 2. trigger 3. Generate 4. insert

Slide 8

Slide 8 text

サーバーレスアーキテクチャ Cloud Storage Cloud Run Eventarc Vertex AI API Firestore

Slide 9

Slide 9 text

プロダクト概要 - Cloud Run 特長 ● コンテナをデプロイするだけで外部から到達可能な URL が発行される ● 0 〜 N へトラフィックに応じて高速にスケーリング ● イベント駆動で処理を実行 ● HTTP/2, WebSocket, gRPC への対応 ● 高度なトラフィック管理が統合サービスメッシュのサポート Preview ● トラフィック管理の強化 ● 可観測性の向上 ● 暗黙的なサービス間認証（実装変更なし） Cloud Run Jobs ● HTTP リクエストに依らない実行 ● 分散タスクの実行で、より長時間の実行が可能 ● 明示的な並列処理や、リトライ回数を定義

Slide 10

Slide 10 text

プロダクト概要 - Vertex AI 生成 AI 関連の特長 ● プロンプトにテキスト、画像、動画、音声、ドキュメントなどのデータだけでなく、複数のデータ（マルチモーダル）を含めることが可能 ● テキストの多次元ベクトルデータを作成し、ベクトル検索を可能に ● モデルのチューニングも可能 Model Garden ● Google 製（Gemini、Imagen、Codey）、サードパーティ製（Anthropic の Claude Model Family）、オープンモデル（Gemma、Llama 3.1）など、幅広いモデルを選択して API アクセス可能 Agent Builder ● 開発者が自然言語またはコードを使用して、 AI エージェントとアプリを構築できるローコードプラットフォーム

Slide 11

Slide 11 text

プロダクト概要 - Firestore 特長 ● スケーラブルでメンテナンス不要のサーバーレスドキュメント DB ● スキーマレスで柔軟なデータモデル ● 従量課金（オペレーション、ストレージ、ネットワーク帯域幅） ● クライアントとリアルタイム同期可能 ● Firebase と統合 ● 無料枠が存在ベクトル検索のサポート ● K 最近傍（KNN）ベクトル検索が可能 ● 開発の柔軟性とコスト効率を高めることが可複数の DB 対応（Datastore モードと混合も可） ● 1 プロジェクト内でリージョン、また、 Firestore モードの種別を分けた複数データベースが作成可能

Slide 12

Slide 12 text

データの登録の一例

Slide 13

Slide 13 text

PDF データがアップロードされる Cloud Storage

Slide 14

Slide 14 text

イベントをトリガーに POST リクエスト Cloud Storage Cloud Run Eventarc Request body { “bucket”: “GCS バケット名”, “name”: “オブジェクト PATH”, “contentType”: “application/pdf”, "updated": "2024-09-11T08:31:03.618Z" ... }

Slide 15

Slide 15 text

PDF データを取得して chunk 分割後、テキストエンベディングを作成 Cloud Storage Cloud Run Eventarc Vertex AI テキストエンべディング chunk 毎にテキスト分割 768 次元ベクトル [ -0.010465549305081367, 0.037910543382167816, 0.0072224168106913567, … ]

Slide 16

Slide 16 text

Field に対してベクトルインデックス作成 Cloud Storage Cloud Run Eventarc Vertex AI Firestore gcloud firestore indexes composite create \ --collection-group=collection-group \ --query-scope=COLLECTION \ --field-config field-path=vector-field,vector-config='vector-configuration' \ --database=database-id

Slide 17

Slide 17 text

chunk 毎のベクトルデータや、メタデータ登録 Cloud Storage Cloud Run Eventarc Vertex AI Firestore ドキュメント { “chunk”: “レストラン名: …”, “embedding”: Vector<768>, “metadata”: … }

Slide 18

Slide 18 text

データの検索

Slide 19

Slide 19 text

クライアントからリクエスト Cloud Run この店のメニューの前菜が見たい

Slide 20

Slide 20 text

プロンプトのテキストエンべディングを作成 Cloud Run Vertex AI テキストエンべディング 768 次元ベクトル [ -0.010465549305081367, 0.037910543382167816, 0.0072224168106913567, … ]

Slide 21

Slide 21 text

Firestore でベクトル検索 Cloud Run Firestore Python の例 from google.cloud import firestore from google.cloud.firestore_v1.base_vector_query import DistanceMeasure from google.cloud.firestore_v1.vector import Vector db = firestore.Client(project=project_id) collection = db.collection(COLLECTION_NAME) collection.find_nearest( vector_field=EMB_FIELD_NAME, query_vector=Vector(query_embedding), distance_measure=DistanceMeasure.EUCLIDEAN, limit=5, )

Slide 22

Slide 22 text

取得したデータを背景に、 LLM に生成リクエスト Cloud Run Vertex AI Python の例 history = [] for snapshot in vector_query.get(): text_chunk = snapshot.get("chunk") history.append(Content(role="model", parts=[Part.from_text(text_chunk)])) history.append(Content(role="user", parts=[Part.from_text(query.query)])) responses = generation_model.generate_content( contents=history, generation_config={ "max_output_tokens": 8192, "temperature": 1, "top_p": 0.95, }, )

Slide 23

Slide 23 text

期待する出力結果をレスポンスとして返す Cloud Run Vertex AI この店のメニューの前菜は、以下のとおりです：雲形ブルスケッタ：グリルしたパンにフレッシュトマト、バジル、オリーブオイルをトッピング。雲の形に仕上げました。 ¥1200 …

Slide 24

Slide 24 text

分析もしたほうがベター

Slide 25

Slide 25 text

入力、出力、関連情報をまとめてデータ保持 Cloud Run Vertex AI BigQuery Pub/Sub { “question”: “この店のメニューの前菜が見たい ”, “answer”: “この店のメニューの前菜は ...”, “metadata”: { （DB データ、template、利用モデル、レイテンシなど） } }

Slide 26

Slide 26 text

ML.GENERATE_TEXT 関数を利用したクエリで要約評価 Cloud Run Vertex AI BigQuery Pub/Sub ML.GENERATE_TEXT

Slide 27

Slide 27 text

まとめ ● 今回のフローは一例で、他プロダクトや API を利用する方法も当然あります ● VM や VPC ネットワークの作成不要で RAG を実践できるのが優位なポイント ○ Cloud Storage (Object storage) ○ Cloud Run (Web App / API / Data transform) ○ Firestore (DB / Vector search) ○ Vertex AI (GenAI text generation / embeddings) ○ BigQuery (Analytics) ● Google Cloud のサーバーレス環境で、生成 AI アプリを開発してみませんか？

Slide 28

Slide 28 text

ちょっとだけ宣伝

Slide 29

Slide 29 text

すべての Google Cloud 開発者、技術者、学生のためのメンバーシッププログラム！知る多彩なコンテンツで最新情報が学べる高める学習プログラムでスキルアップできるつながるキャリアや年齢を超えた仲間と交流できる cloud.google.com/innovators ご登録はこちらメンバー特典メンバー登録受付中！コミュニティオンライン学習プラットフォーム「 Google Cloud Skills Boost 」を活用できるよう、毎月 35 クレジットが無料で付与されます。

Slide 30

Slide 30 text

Innovators Live Japan デベロッパー・エンジニア向けのセッションをライブ配信でお届け！ https://goo.gle/GCI-LIVE-JP Google Cloud のメンバーやユーザーが、 Google Cloud やデベロッパー界隈で注目のトピックについて、トークを繰り広げます。 AI / ML クラウドネイティブ開発 DevOps / SRE データ分析 Game (GEM) ウェビナーご登録はこちら Community

Slide 31

Slide 31 text

Thank you