Azure AI Search入門 - 基本概念理解からAzure OpenAI Searchとの連携まで

Azure AI Search入門基本概念理解からAzure OpenAI Searchとの連携まで株式会社電通総研 Xイノベーション本部 AIトランスフォーメーションセンター
山田侑樹

目次第I部 - Azure AI Searchの基本概念理解編 • Azure AI Searchとは
• Azure AI Searchを理解するための用語・概念整理 • 全文検索とベクトル検索の違い • Azure AI Searchの検索インデックスにデータを投入する方法第II部 – インデクサーでのAzure OpenAI Serviceとの連携編 • Azure OpenAI Serviceと連携したRAGアーキテクチャ • インデクサーによるチャンク分割、ベクトル化、保存する方法 2

第I部 - Azure AI Searchの基本概念理解編 • Azure AI Searchとは •
Azure AI Searchを理解するための用語・概念整理 • 全文検索とベクトル検索の違い • Azure AI Searchの検索インデックスにデータを投入する方法 3

Azure AI Searchとは？ ▍ Azureのフルマネージドの検索サービス ▍ 全文検索、ベクトル検索、ハイブリッド検索、あいまい検索、自動補完、geo検索など豊富な検索ソリューションに対応 ▍ 他のAzureサービスとの強力な統合機能を提供
⚫ データソースから自動での検索インデックスへの保存処理（インデクサー） ⚫ OCRやテキストの翻訳などデータソースのコンテンツをAIで解析（スキル、エンリッチメント、ナレッジストア） 4

Azure AI Searchに保存されるデータに関する用語と概念 5 用語概要検索インデックス検索のためのデータのコレクション。 1つの検索インデックス内に複数のドキュメントが格納される。 ※単に「インデックス」と表記をする場合もあるが本資料内では「検索インデック
ス」と表記する。スキーマ検索インデックスの構造を定義するもの。スキーマは、検索インデックスに格納されるドキュメントにどのようなフィールドが含まれ、それぞれのデータ型など情報を含む。ドキュメント検索インデックス内に格納される個々のデータ項目。 Azure AI SearchではJSON形式で表現される。フィールドドキュメント内の個々の属性を示す。RDBの列に似たもので型が存在する。フィールドによって検索結果の並び替えやフィルタリングが行える。

Azure AI Searchに保存されるデータに関する用語と概念 6

Azure AI Searchのスケーラビリティに関する用語と概念 7 用語概要 SU （検索ユニット、スケールユニット） Azure
AI Searchサービスの課金単位。 SUの数はレプリカとパーティションの数によって決定される。レプリカ Azure AI Searchでホストされるインスタンスの数。各レプリカは検索インデックスの完全なコピーを持っており、独立でクエリの処理が可能。レプリカ数を増やすことで負荷分散、高可用性を実現できる。パーティション Azure AI Searchでのストレージの単位。パーティションを増やすと書き込み性能が向上する。シャード検索インデックスを分割した単位。 Azure AI Searchでは各インデックスは事前にシャードの単位で分割され、パーティションごとに均等に分散されて保存される。なおシャードは実装の詳細であるためサービス利用者が意識する必要はない。

Azure AI Searchのスケーラビリティに関する用語と概念検索ユニット（SU）はレプリカとパーティションの数によって決まる左図は以下のイメージで作成 - レプリカ数 1
- パーティション数 2 この場合はSUは2となる 8

Azure AI Searchのスケーラビリティに関する用語と概念可用性に影響を与えるのは「レプリカ数」読み取り/書き取りで99.9%の可用性が必要な場合は3つ以上のレプリカが必要パーティションは全てのレプリカに適用されるため、レプリカ数が
多いリソースでパーティションを増加させるとコストインパクトが大きい 9

Azure AI Search のプランによる制限作成可能な検索インデックスの数、ストレージの容量、スケール上限はプランによって決まっているので注意が必要 10

Azure AI Searchでサポートされる検索シナリオ Azure AI Search は「全文検索」と「ベクトル検索」のどちらにも対応している ❖ 全文検索
フルテキストインデックスによって作成された転置インデックスを利用してドキュメントを検索する ❖ ベクトル検索ベクトルの近傍検索によってドキュメントを検索する 11

全文検索を理解するための用語と概念 12 用語概要転置インデックス文書に含まれる各単語（トークン）とその単語が出現する文書IDの組み合わせによって構成される索引（インデックス）。これにより単語が含まれる文書を高速に探し出すことができる。アナライザー転置インデックスを構成する際に、文章を単語（トークン）の単位に分割する処理機能やコ
ンポーネントを指す。アナライザーでは単語分割（形態素解析）やノイズとなる単語（ストップワード）の除去、小文字や原型への変換処理などが行われる。

転置インデックスの作成処理転置インデックスに格納される単語はアナライザーの種類によって単語分割などの処理が異なる 13

転置インデックスを利用した検索処理検索クエリもアナライザーによる単語の分割が行われる 14

Azure AI Searchで利用可能なアナライザー利用可能なアナライザーは大きく分けると2種類ある • 組み込みアナライザー組み込みのアナライザーには標準Luceneのアナライザー、言語固有アナライザー、特殊アナライザーがある。言語固有アナライザーはLucene言語アナライザーとMictosoft 言語アナライザーがある。
• カスタムアナライザーユーザー定義のアナライザー。組み込みのアナライザーを拡張するようなこともできる。 15

ベクトル検索を理解するための用語と概念 16 用語概要 Embedding （埋め込みベクトル、分散表現）テキストなどのデータを多次元のベクトルとして表現したもの。意味的に類似性の高いコンテンツはベクトル空間内で互いに近くに位置する。 vectorizer
（ベクタライザー）テキストなどembeddingに変換するコンポーネント最近傍検索与えられたクエリポイント（ベクトル値）に最も近いデータポイントをベクトル空間から探索する方法。クエリポイントと各データポイントのベクトル間の距離を計算し、最も距離が小さいポイントを特定する必要があるため大規模なデータほど計算コストが必要になる。近似最近傍検索与えられたクエリポイント（ベクトル値）に近似的に最も近いデータポイントをベクトル空間から探索する方法。正確さに犠牲にしパフォーマンスを向上させる方法であり、大規模なデータにも対応できる。

ベクトルによる検索処理ベクトル検索ではユーザーのクエリをベクタライザーを用いて保存されているベクトルの次元と揃えてから近傍検索を行う 17

ハイブリッド検索 Azure AI Searchは全文検索とベクトル検索を組み合わせたハイブリッド検索をサポートしているハイブリッド検索は「全文検索」と「ベクトル検索」の結果をReciprocal Rank Fusion (RRF) というアルゴリズムで再ランク付けするもの
つまり内部的には全文検索とベクトル検索の両方が行われる 18

Azure AI Search を使った検索サービスを実現するまでの手順 Azure AI Searchにデータを保存するには最初に検索インデックスを作成する必要がある 19 本資料で紹介する範囲

検索インデックスの作成検索インデックスを作成する際は、検索対象のデータ特性とユースケースに合わせてスキーマの設計を行う 20

フィールドの属性フィールドはデータ型に加えて、検索時にフィールドがどのように使用されるかを示す属性を定義する 21 属性概要 searchable フルテキストインデックスを作成するかを制御する filterable $filterクエリで参照できるかを制御する
sortable ソート対象に利用できるかを制御する facetable 検索結果の集約化に利用するかを制御する key ドキュメントの一意識別子となるフィールドこのフィールドは文字列（Edm.string）で定義される retrievable 検索結果に含めるかを制御する Falseにしたフィールドはスコアリングの内部ロジックなどに応用できる

検索インデックスのスキーマ設計時のポイント • ユースケースに応じてスキーマ設計を行う  検索可能フィールドは必要なものだけを定義する  フィルタやソートもインデックスサイズに影響を及ぼす • インデックスのサイズと検索パフォーマンスにはトレードオフがあることを理解するリッチなスキーマを定義することで強力な検索機能を実現できるが、より多くのスト
レージを利用することになるため、高価なプランが必要になりコストが増加する場合もある 22

インデックスへのデータの投入インデックスへのデータ投入方法はPushモデルとPullモデルがある 23 • Pushモデル Azure SDK・REST APIを利用しインデックスにJSON形式のドキュメントをPushする方法 •
Pullモデル Azure AI Searchがサポートしているデータソースをクロールし、自動でインデックスにドキュメントを作成する方法

Pushモデル vs Pullモデル • Pushモデルの利点  任意のデータソースから検索インデックスにドキュメントを登録できる  検索結果にリアルタイム性をサポートできる •
Pullモデルの利点  スケジューリングによる自動更新のサポート  データソースの変更追跡によるドキュメントの最新化  スキルセットによるエンリッチメントのサポート 24

Pushモデルを利用する場合 Pushモデルは任意のプログラミング言語で検索インデックスへのドキュメント保存処理を記述可能 25

その他のPushモデルの参考アーキテクチャ https://learn.microsoft.com/ja-jp/azure/architecture/ai-ml/architecture/automate-document- classification-durable-functions 26

Pullモデルを利用する場合 Pullモデルを利用する場合は、インデクサーを使って検索インデックスにドキュメントを保存する 27

Pullモデルを理解するための用語と概念 28 用語概要データソースインデクサーのデータ抽出対象となるクラウド上のデータソース Azure Blob StorageやAzure Cosmos
DBなどがサポートされるインデクサーインデクサーはデータソースのデータをAzure AI Searchの検索インデックスのスキーマ構造にマッピングする処理を行うコンポーネント一般的な検索システムの「クローラー」のような処理を担うスキルインデクサーでコンテンツを検索インデックスに投入する際に、コンテンツを変換する単一の操作を提供するものスキルセットスキルセットは特定のインデクサーで利用するスキルの集合。少なくとも1つのスキルから構成され、最大で30のスキルを含む。エンリッチメントインデクサーの拡張機能で、画像などのテキスト情報を持たないデータを検索可能な構造に変換するものナレッジストアエンリッチメントされたコンテンツを保存するストレージ Azure Blob StorageやAzure Table Storageを利用できる

インデクサーによる検索インデックスへのデータ投入の流れ Azure AI Searchにデータソース、スキルセットと作成し、それらを利用するインデクサーを作成する 29

その他のPushモデルの参考アーキテクチャ https://learn.microsoft.com/ja-jp/azure/architecture/ai-ml/architecture/search-blob-metadata 30

第II部 – インデクサーでのAzure OpenAI Serviceとの連携編 • Azure OpenAI Serviceと連携したRAGアーキテクチャ •
インデクサーによるチャンク分割、ベクトル化、保存する方法 31

Azure OpenAI Serviceと連携したRAGアーキテクチャ Azure OpenAI ServiceでのRetrieval-Augmented Generation（RAG）実現のために Azure AI Searchが利用される
32

Azure OpenAI Serviceとの連携 RAGアプリを作成するのにAzure OpenAI ServiceとAzure AI Searchを組み合わせは Micrtosoftイチ押しの形 33
https://azure.microsoft.com/ja-jp/products/ai-services/ai-search

Azure OpenAI Serviceとの接続インデクサーを使ってのAzure OpenAI Serviceとの連携はAzureポータルの「データのインポートとベクター化」から実施できる ※ 現状プレビュー版のためPython SDKからは作成不可
34

Azure OpenAI Serviceとの接続 35

この操作の裏側で行われていること先の検索インデックスへのデータ投入の流れと同じことが裏側で行われている 36

利用されるスキル - テキスト分割スキル（TextSplitSkill）チャンク分割をするスキル https://learn.microsoft.com/ja-jp/azure/search/cognitive-search-skill-textsplit 37 { "@odata.type": "#Microsoft.Skills.Text.SplitSkill", "name":
"#1", "description": null, "context": "/document", "defaultLanguageCode": "en", "textSplitMode": "pages", "maximumPageLength": 2000, "pageOverlapLength": 100, "maximumPagesToTake": 1, },

利用されるスキル - Azure OpenAI Embedding スキル（プレビュー） Azure OpenAIでEmbedding化を行うスキル https://learn.microsoft.com/ja-jp/azure/search/cognitive-search-skill-azure-openai-
embedding 38 { "@odata.type": "#Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill", "name": "#2", "description": "Azure OpenAI Embedding Skill", "context": "/document/pages/*", "resourceUri": "https://*****.openai.azure.com", "apiKey": "*****", "deploymentId": "emebedding-ada-002", "authIdentity": null }

マッピングされる検索インデックスのスキーマこの機能を使ってマッピングされる対象の検索インデックスのスキーマには制限があり、既存のインデックスへのマッピングは不可 39

インデックスプロジェクション（プレビュー）内部でのマッピング処理ではインデックスプロジェクションという機能も利用されている通常インデクサーは1ファイルを1つのドキュメントにマッピングするがチャンク分割、ベクトル化が必要で1対多のマッピングが必要 40

インデクサーの計算リソースインデクサーはAzure AI Searchのマネージド環境で実行される 41 環境概要プライベート環境リソース固有の環境。ここで実行されるインデクサージョブは最大24時間実行可能。
プライベート環境で実行可能なインデクサージョブの数は検索ユニットで1つ。プライベートエンドポイント経由で他のリソースにアクセスする必要があるインデクサージョブはこの環境で実行する必要があるマルチテナントマネージドな環境。ここで実行されるインデクサージョブは最大2時間実行可能。実行できるインデクサージョブの数は不確定。

インデクサーとプライベートエンドポイント接続プライベートエンドポイント接続をするためには共有プライベートリンクを作成する必要がある AIエンリッチメントなど計算リソースを消費するインデクサージョブのプライベートエンドポイント経由での実行にはAzure AI SearchのS2/S3、L1/L2プランが必要つまりコスト面、非機能要件面も視野に入れてプランを選択する必要がある 42

インデクサーによるAzure OpenAI Serviceとの連携まとめ ▍ 現状は内部でプレビュー版の機能が多く使われておりプロダクションでは使えない ▍ スキルなどのパラメータは十分カスタマイズ可能なものが設定されているので、SDKなどから操作がサポートされると安定して使えそうなビジョンはある 43

CONFIDENTIAL 44

Azure AI Search入門 - 基本概念理解からAzure OpenAI Searc...

Azure AI Search入門 - 基本概念理解からAzure OpenAI Searchとの連携まで

AITC - DENTSU SOKEN

More Decks by AITC - DENTSU SOKEN

Other Decks in Technology

Featured

Transcript

Azure AI Search入門基本概念理解からAzure OpenAI Searchとの連携まで株式会社電通総研 Xイノベーション本部 AIトランスフォーメーションセンター

目次第I部 - Azure AI Searchの基本概念理解編 • Azure AI Searchとは

第I部 - Azure AI Searchの基本概念理解編 • Azure AI Searchとは •

Azure AI Searchに保存されるデータに関する用語と概念 6

Azure AI Searchのスケーラビリティに関する用語と概念 7 用語概要 SU （検索ユニット、スケールユニット） Azure

Azure AI Searchのスケーラビリティに関する用語と概念検索ユニット（SU）はレプリカとパーティションの数によって決まる左図は以下のイメージで作成 - レプリカ数 1

Azure AI Search のプランによる制限作成可能な検索インデックスの数、ストレージの容量、スケール上限はプランによって決まっているので注意が必要 10

Azure AI Searchでサポートされる検索シナリオ Azure AI Search は「全文検索」と「ベクトル検索」のどちらにも対応している ❖ 全文検索

転置インデックスの作成処理転置インデックスに格納される単語はアナライザーの種類によって単語分割などの処理が異なる 13

転置インデックスを利用した検索処理検索クエリもアナライザーによる単語の分割が行われる 14

ベクトルによる検索処理ベクトル検索ではユーザーのクエリをベクタライザーを用いて保存されているベクトルの次元と揃えてから近傍検索を行う 17

Azure AI Search を使った検索サービスを実現するまでの手順 Azure AI Searchにデータを保存するには最初に検索インデックスを作成する必要がある 19 本資料で紹介する範囲

検索インデックスの作成検索インデックスを作成する際は、検索対象のデータ特性とユースケースに合わせてスキーマの設計を行う 20

インデックスへのデータの投入インデックスへのデータ投入方法はPushモデルとPullモデルがある 23 • Pushモデル Azure SDK・REST APIを利用しインデックスにJSON形式のドキュメントをPushする方法 •

Pushモデル vs Pullモデル • Pushモデルの利点  任意のデータソースから検索インデックスにドキュメントを登録できる  検索結果にリアルタイム性をサポートできる •

Pushモデルを利用する場合 Pushモデルは任意のプログラミング言語で検索インデックスへのドキュメント保存処理を記述可能 25

その他のPushモデルの参考アーキテクチャ https://learn.microsoft.com/ja-jp/azure/architecture/ai-ml/architecture/automate-document- classification-durable-functions 26

Pullモデルを利用する場合 Pullモデルを利用する場合は、インデクサーを使って検索インデックスにドキュメントを保存する 27

Pullモデルを理解するための用語と概念 28 用語概要データソースインデクサーのデータ抽出対象となるクラウド上のデータソース Azure Blob StorageやAzure Cosmos

インデクサーによる検索インデックスへのデータ投入の流れ Azure AI Searchにデータソース、スキルセットと作成し、それらを利用するインデクサーを作成する 29

その他のPushモデルの参考アーキテクチャ https://learn.microsoft.com/ja-jp/azure/architecture/ai-ml/architecture/search-blob-metadata 30

第II部 – インデクサーでのAzure OpenAI Serviceとの連携編 • Azure OpenAI Serviceと連携したRAGアーキテクチャ •

Azure OpenAI Serviceと連携したRAGアーキテクチャ Azure OpenAI ServiceでのRetrieval-Augmented Generation（RAG）実現のために Azure AI Searchが利用される

Azure OpenAI Serviceとの連携 RAGアプリを作成するのにAzure OpenAI ServiceとAzure AI Searchを組み合わせは Micrtosoftイチ押しの形 33

Azure OpenAI Serviceとの接続インデクサーを使ってのAzure OpenAI Serviceとの連携はAzureポータルの「データのインポートとベクター化」から実施できる ※ 現状プレビュー版のためPython SDKからは作成不可

Azure OpenAI Serviceとの接続 35

この操作の裏側で行われていること先の検索インデックスへのデータ投入の流れと同じことが裏側で行われている 36

利用されるスキル - テキスト分割スキル（TextSplitSkill）チャンク分割をするスキル https://learn.microsoft.com/ja-jp/azure/search/cognitive-search-skill-textsplit 37 { "@odata.type": "#Microsoft.Skills.Text.SplitSkill", "name":

利用されるスキル - Azure OpenAI Embedding スキル（プレビュー） Azure OpenAIでEmbedding化を行うスキル https://learn.microsoft.com/ja-jp/azure/search/cognitive-search-skill-azure-openai-

マッピングされる検索インデックスのスキーマこの機能を使ってマッピングされる対象の検索インデックスのスキーマには制限があり、既存のインデックスへのマッピングは不可 39

インデクサーの計算リソースインデクサーはAzure AI Searchのマネージド環境で実行される 41 環境概要プライベート環境リソース固有の環境。ここで実行されるインデクサージョブは最大24時間実行可能。

CONFIDENTIAL 44