Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マルチクラウド時代における RAG アーキテクチャ構築 手順書

マルチクラウド時代における RAG アーキテクチャ構築 手順書

マルチクラウドが当たり前の現代において、様々な環境に保管されたデータの取り扱いには工夫が必要です。特に生成AIが流行し様々なアプリケーションとの統合が進んでいる昨今、貴重な情報を持ったデータを利活用することは自社製品に付加価値を与えるために欠かせません。本資料では、Microsoft Fabric という製品を活用し、AWS S3 にあるデータを Azure 上で構築する RAG アプリケーションに取り込むための基本的な設定手順を紹介しています。Microsoft Fabric を活用することでマイクロソフトクラウド以外の環境にあるデータを簡単に統合し、アプリケーション開発に役立てることができます。

※本資料は2024年6月時点での情報を元に作成されています。
※閲覧時には UI が変わっている可能性があることを予めご了承ください。
※製品の機能や最新情報は製品開発元の公式ドキュメントをご参照ください。

Takunori Minamisawa

June 18, 2024
Tweet

Other Decks in Technology

Transcript

  1. マルチクラウド時代における RAG アーキテクチャ構築 手順書 -AWS S3 上にあるデータを RAG に活用してみよう編- Microsoft

    Japan Digital Startups & ISV Takunori MINAMISAWA ※本資料は2024年6月時点の情報を元に作成されています。
  2. Azure における RAG アプリケーションの構成例 Front-end Control and Store AI Services

    Data Analytics Data Source Application App Service Static Web Apps API Control API Management Chat Logs Cosmos DB User Info DB for MySQL Generative AI Functions OpenAI Service Knowledge Search AI Search Caching External API AI-based Data Lake Microsoft Fabric Customer Data AWS S3 Google Cloud Storage Cache for Redis Development VS Code GitHub Copilot Blob Storage Monitoring Defender for Cloud Monitor Log Analytics Application Insights Authentication Entra ID Bing Search Custom Search
  3. 本手順書で作成するのは「赤枠」で囲まれた部分になります Front-end Control and Store AI Services Data Analytics Data

    Source Application App Service Static Web Apps API Control API Management Chat Logs Cosmos DB User Info DB for MySQL Generative AI Functions OpenAI Service Knowledge Search AI Search Caching External API AI-based Data Lake Microsoft Fabric Customer Data Cache for Redis Development VS Code GitHub Copilot Monitoring Defender for Cloud Monitor Log Analytics Application Insights Bing Search Custom Search AWS S3 Google Cloud Storage Blob Storage Authentication Entra ID
  4. 構築前に確認すること Entra ID Microsoft Fabric Microsoft Azure Azure と Microsoft

    Fabric は 同じテナント配下で使いましょう Azure と Microsoft Fabric が利用できる 法人メールアドレスが必要です Azure のリソースをするための Azure Subscription が必要です
  5. Agenda セクション 1 AWS S3 バケットの作成 セクション 2 Microsoft Fabric

    の環境準備 セクション 3 Azure AI Search の環境準備
  6. 「ファイルを追加」から任意のファイルを選択します ※注意点 Azure AI Search の OneLake ファイル インデクサーで対応しているファイル形 式を公式ドキュメントで確認した上で

    アップロードしてください。 -CSV -PDF -HTML -JSON -EML -Microsoft Office 形式 など https://learn.microsoft.com/ja- jp/azure/search/search-how-to-index- onelake-files#supported-document-formats
  7. 以下の JSON 形式でポリシーを入力します { "Version": "2012-10-17", “Id”: “任意の値", "Statement": [

    { "Sid": "statement1", "Effect": "Allow", "Principal": { “AWS”: “先ほどコピーした ARN" }, "Action": [ "s3:GetObject", "s3:GetBucketLocation", "s3:ListBucket" ], "Resource": [ “arn:aws:s3:::S3バケット名", "arn:aws:s3:::S3バケット名/*" ] } ] }
  8. コピーしておいた各種情報を入力し「次へ」進みます オブジェクト URL (ファイル名無し) Access Key Secret Access Key ※注意点

    2024年6月時点、日本語 UI の翻訳ミスで「ユーザー名」「パス ワード」との記載になっていますが、入力事項は「Access Key」 と「Secret Access Key」になります。
  9. 本手順書で作成したのは「赤枠」で囲まれた部分になります Front-end Control and Store AI Services Data Analytics Data

    Source Application App Service Static Web Apps API Control API Management Chat Logs Cosmos DB User Info DB for MySQL Generative AI Functions OpenAI Service Knowledge Search AI Search Caching External API AI-based Data Lake Microsoft Fabric Customer Data Cache for Redis Development VS Code GitHub Copilot Monitoring Defender for Cloud Monitor Log Analytics Application Insights Bing Search Custom Search AWS S3 Google Cloud Storage Blob Storage Authentication Entra ID
  10. • 本書に記載した情報は、本書各項目に関する発行日現在の Microsoft の見解を表明するものです。Microsoft は絶えず変化する市場に対応しなければならないため、ここに記載し た情報に対していかなる責務を負うものではなく、提示された情報の信憑性については保証できません。 • 本書は情報提供のみを目的としています。 Microsoft は、明示的または暗示的を問わず、本書にいかなる保証も与えるものではありません。

    • すべての当該著作権法を遵守することはお客様の責務です。Microsoft の書面による明確な許可なく、本書の如何なる部分についても、転載や検索システムへの格納または挿入を 行うことは、どのような形式または手段(電子的、機械的、複写、レコーディング、その他)、および目的であっても禁じられています。これらは著作権保護された権利を制限 するものではありません。 • Microsoft は、本書の内容を保護する特許、特許出願書、商標、著作権、またはその他の知的財産権を保有する場合があります。Microsoft から書面によるライセンス契約が明確 に供給される場合を除いて、本書の提供はこれらの特許、商標、著作権、またはその他の知的財産へのライセンスを与えるものではありません。 • Microsoft, Windows, その他本文中に登場した各製品名は、Microsoft Corporation の米国およびその他の国における登録商標または商標です。その他、記載されている会社名 および製品名は、一般に各社の商標です。 © 2024 Microsoft Corporation. All rights reserved.