AI エージェントの記憶検索における Vertex AI の活用【2023/11/16 Google Cloud Next Tokyo ’23】

Proprietary AI エージェントの記憶検索における Vertex AI の活用

Proprietary Google Cloud Next Tokyo ’23 椿京介株式会社Gaudiy /
エンジニア

Proprietary Google Cloud Next Tokyo ’23 目次 01 サービス説明 02
ベクトル検索の評価 03 ベクトル化モデルの比較評価

Proprietary Google Cloud Next Tokyo ’23 01 サービス説明 1.1 ユーザーの
AI アバターを介した新たな SNS 1.2 サービス実現に必要な技術 1.3 実現したい要件・制約

Proprietary Google Cloud Next Tokyo ’23 ユーザーの AI アバターを介した新たな
SNS

Proprietary Google Cloud Next Tokyo ’23 サービス実現に必要な技術 • 大規模なベクトル検索する基盤 •
文章を適切に汲み取るベクトル化アルゴリズム (※)RAG（Retrieval Argumented Generation）: 外部のDB・Webからデータを検索して、LLMのプロンプトにFew-Shotでコンテキストを加えることで回答精度を上げる手法のこと。

Proprietary Google Cloud Next Tokyo ’23 • ベクトル検索 ◦ 条件付き検索：マルチテナント別、会話の種類、ユーザー別
◦ パフォーマンス：コミュニティの活性化によるデータ量の増大 • ベクトル化アルゴリズム ◦ 精度：文脈に合う適切な会話を実現するためベクトル化の品質を重視 ◦ 多言語対応：国外への展開予定 ◦ パフォーマンス：大量に処理するためベクトル変換のレイテンシを重視実現したい要件・制約

Proprietary Google Cloud Next Tokyo ’23 02 ベクトル検索の評価 2.1 現状のベクトル検索
2.2 スケーラビリティの課題 2.3 Vertex AI を用いたベクトル検索 2.4 ベクトル検索の評価条件 2.5 自前実装と Vertex AI の比較 2.6 Vertex AI Vector Search 2.7 実用的なベクトル検索

Proprietary Google Cloud Next Tokyo ’23 ベクトルストア: Cloud Spanner 全ベクトルを取得する構成
ベクトル化: OpenAI Embedding 1536 次元に埋め込みベクトル検索: 独自実装メモリに全部載せて全探索現状のベクトル検索

Proprietary Google Cloud Next Tokyo ’23 スケーラビリティの課題 • ビジネス上、データ量が増大しやすい ◦
コミュニティの活発化 / AI アバターの増加 ◦ 導入企業増加 ◦ ユースケース増加に伴う検索フィルターの複雑化 • データ量増加に伴うシステムの限界 ◦ メモリ使用量の増加 ◦ O(Ｎ^2) で伸びるレイテンシ（全N件の探索を 2 回行うため） ◦ ベクトル次元数の異なるモデルに移行するのが困難

Proprietary Google Cloud Next Tokyo ’23 ベクトルストア: Vertex AI Vector
Search 全ベクトルを取得する構成ベクトル化: OpenAI Embedding 1536 次元に埋め込みベクトル検索: Vector Search 比較のため最近傍探索 (ANN も使える) Vertex AI を用いたベクトル検索

Proprietary Google Cloud Next Tokyo ’23 ベクトル検索の評価条件 • データ ◦
次元: 1536 ◦ データサイズ: 100, 500, … ,10000 • 検証方法 ◦ 負荷検証ツール: k6 ◦ リクエスト数: 100 • 評価指標 ◦ 平均値, パーセンタイル (90, 95)

Proprietary Google Cloud Next Tokyo ’23 自前実装と Vertex AI の比較
Gaudiy調べ自前実装と比較して • レスポンスタイムが10000倍高速 • データサイズが増加してもレスポンスタイムが比例して増加しない

Proprietary Google Cloud Next Tokyo ’23 Vertex AI Vector Search
の性能 Gaudiy調べ

Proprietary Google Cloud Next Tokyo ’23 柔軟な検索性リアルタイムにインデックスを更新でき、Namespace で検索
領域を限定できる。実用的なベクトル検索変更容易性ベクトルインデックスと検索実行環境が分離されているため、ベクトルの次元数やマシンスペックの変更が容易に行える。スケーラビリティ最近近傍探索（ANN）によって、高再現率で数十億のベクトルに対してわずか数ミリで検索可能。

Proprietary Google Cloud Next Tokyo ’23 03 ベクトル化モデルの比較評価 3.1 良いベクトルとは？
3.2 ベクトル化モデルの評価手順 3.3 使用するモデル 3.4 モデルの評価 3.5 総合評価

Proprietary Google Cloud Next Tokyo ’23 良いベクトルとは？ • 文章の意味的類似性を正しく評価するためには良質なモデルが必要 •
ベクトル化の品質が悪いと文脈にミスマッチなコミュニケーションが発生 • 日本語だけではなく多言語に対応したモデルが必要文1: 海の上でサーフボードに乗っている犬がいます。文2: サーフボードに乗った犬が、海の上にいます。類似性: 高文1: 遠くに山合いの見える場所に飛行機が飛んでいます。文2: 競技場でサッカーをしている人達がいます。類似性: 低

Proprietary Google Cloud Next Tokyo ’23 各モデルでベクトル化 Vertex AI や
OpenAI、 Hugging Face 上で公開されている Text Embedding モデルを使用し、ベクトル化を行います。 1 2 3 ベクトル化モデルの評価手順データセットの用意日本語のデータセットである JSTS を使用します。JSTS は２文間の類似度（0~5）で評価されている文ペアの集合。モデル評価 Pearson / Spearman の相関係数を使ってスコアを計算し、モデル間の精度評価を行います。

Proprietary Google Cloud Next Tokyo ’23 1. Vertex AI Embedding
for Text textembedding-gecko-multilingual (preview) 2. OpenAI text-embedding-ada–002 3. Microsoft（Hugging Face上で公開） multilingual-e5-large 使用するモデル

Proprietary Google Cloud Next Tokyo ’23 モデルの評価モデル名 textembedding- gecko-multilingual
text-embedding- ada–002 multilingual-e5-la rge ベクトル長 768 1536 1024 pearson / spearman 0.847 / 0.801 0.837 / 0.790 0.862 / 0.819 変換時間(s) / vec 0.069 0.230 0.076 モデル管理不要不要必要 👍 👍 👍 👍 👍

Proprietary Google Cloud Next Tokyo ’23 総合評価ベクトル検索には Vertex AI
の Vector Search を採用検索範囲の柔軟性、低レイテンシ、マシンスペックや探索アルゴリズムなどの変更容易性ベクトル化モデルには Vertex AI Embedding for Text の textembedding-gecko-multilingual を採用 multilingual-e5-large と同等性能でありながら、モデル管理が不必要で多言語対応なモデル

Proprietary Google Cloud Next Tokyo ’23 Join us! 他にもAI、Web3周りのテックブログを発信しています。興味ある方はぜひ以下の QRコードからアクセスしてみてください！採用も絶賛募集中。
採用ページ

Thank you Proprietary

AI エージェントの記憶検索における Vertex AI の活用【2023/11/16 Goo...

AI エージェントの記憶検索における Vertex AI の活用【2023/11/16 Google Cloud Next Tokyo ’23】

tsubaki kyosuke

More Decks by tsubaki kyosuke

Featured

Transcript

Proprietary AI エージェントの記憶検索における Vertex AI の活用

Proprietary Google Cloud Next Tokyo ’23 椿京介株式会社Gaudiy /

Proprietary Google Cloud Next Tokyo ’23 目次 01 サービス説明 02

Proprietary Google Cloud Next Tokyo ’23 01 サービス説明 1.1 ユーザーの

Proprietary Google Cloud Next Tokyo ’23 ユーザーの AI アバターを介した新たな

Proprietary Google Cloud Next Tokyo ’23 サービス実現に必要な技術 • 大規模なベクトル検索する基盤 •

Proprietary Google Cloud Next Tokyo ’23 • ベクトル検索 ◦ 条件付き検索：マルチテナント別、会話の種類、ユーザー別

Proprietary Google Cloud Next Tokyo ’23 02 ベクトル検索の評価 2.1 現状のベクトル検索

Proprietary Google Cloud Next Tokyo ’23 ベクトルストア: Cloud Spanner 全ベクトルを取得する構成

Proprietary Google Cloud Next Tokyo ’23 スケーラビリティの課題 • ビジネス上、データ量が増大しやすい ◦

Proprietary Google Cloud Next Tokyo ’23 ベクトルストア: Vertex AI Vector

Proprietary Google Cloud Next Tokyo ’23 ベクトル検索の評価条件 • データ ◦

Proprietary Google Cloud Next Tokyo ’23 自前実装と Vertex AI の比較

Proprietary Google Cloud Next Tokyo ’23 Vertex AI Vector Search

Proprietary Google Cloud Next Tokyo ’23 柔軟な検索性リアルタイムにインデックスを更新でき、Namespace で検索

Proprietary Google Cloud Next Tokyo ’23 03 ベクトル化モデルの比較評価 3.1 良いベクトルとは？

Proprietary Google Cloud Next Tokyo ’23 良いベクトルとは？ • 文章の意味的類似性を正しく評価するためには良質なモデルが必要 •

Proprietary Google Cloud Next Tokyo ’23 各モデルでベクトル化 Vertex AI や

Proprietary Google Cloud Next Tokyo ’23 1. Vertex AI Embedding

Proprietary Google Cloud Next Tokyo ’23 モデルの評価モデル名 textembedding- gecko-multilingual

Proprietary Google Cloud Next Tokyo ’23 総合評価ベクトル検索には Vertex AI

Proprietary Google Cloud Next Tokyo ’23 Join us! 他にもAI、Web3周りのテックブログを発信しています。興味ある方はぜひ以下の QRコードからアクセスしてみてください！採用も絶賛募集中。

Thank you Proprietary