Slide 1

Slide 1 text

AWS活用 Amazon Bedrock #2 Amazon Bedrock Knowledge Bases ナレッジベースの種類 株式会社BLUEISH 代表取締役CEO兼CTO 為藤アキラ @AkiraTameto

Slide 2

Slide 2 text

為藤 アキラ (Akira Tameto) 株式会社BLUEISH 代表取締役 CEO兼CTO ・AWS歴12年 ・直近のAIプロジェクト   ・画像を中心とした機械学習とLLM のハイブリッドのアーキテクト 自己紹介

Slide 3

Slide 3 text

今回の基本編でのゴール ・RAGとは? ・ナレッジベースとは? ・ナレッジベースの種類   - ベクターストアを用いたナレッジベース   - 構造化データストアを用いたナレッジベース   - Amazon Kendra GenAIインデックスを用いたナレッジベース

Slide 4

Slide 4 text

RAGとは?

Slide 5

Slide 5 text

RAGとは? RAG(Retrieval-Augmented Generation)とは、生成型AIに外部の知識を取り 入れることで、より正確で豊富な情報に基づいた文章を生成する手法

Slide 6

Slide 6 text

RAGが重要なのはなぜか? LLM の応答には予測がつかないという問題がある。 さらに、LLM のトレーニングデータは静的であり、蓄積された知識に期限を設け ています。 <LLMの課題U 答えがないのに虚偽の情報を提示すること’ ユーザーが特定の最新の応答を期待している場合に、古くなった、または一 般的な情報を提示する’ 用語の混乱により、異なるトレーニングソースが同じ用語を使用して異なる 内容について話すため、回答が不正確になります。

Slide 7

Slide 7 text

Bedrock Knowledge Bases!

Slide 8

Slide 8 text

Bedrock Knowledge Baseとは?

Slide 9

Slide 9 text

Bedrock Knowledge Basesとは? RAGをエンドツーエンドで支援するフルマネージド機能。 企業のプライベートデータをLLMやエージェントに安全に接続し、文脈に沿っ た回答を生成できる

Slide 10

Slide 10 text

Bedrock Knowledge Basesとは? RAGを で支援するフルマネージド機能。 企業のプライベートデータをLLMやエージェントに安全に接続し、文脈に沿っ た回答を生成できる エンドツーエンド ここでいう「エンドツーエンド」とは、データの取り込みから最終的な回答生 成までの全プロセスを一貫して、シームレスに提供出来るということ

Slide 11

Slide 11 text

Bedrock Knowledge Basesとは? 1. データの取り込み・インジェスト 企業のプライベートデータを安全に収集・統合し、処理可能な形に整備します。 2. インデックス作成・検索 取り込んだデータに対してインデックスを作成し、必要な情報を効率的に検索・抽出できるようにします。 3. 文脈付与・プロンプト生成 検索結果を元に、LLM(大規模言語モデル)やエージェントに与えるための適切な文脈情報やプロンプトを生成します。 4. 回答生成 LLMが提供された文脈情報をもとに、ユーザーの質問に対して適切な回答を生成します。

Slide 12

Slide 12 text

ナレッジベースの種類

Slide 13

Slide 13 text

ナレッジベースの種類

Slide 14

Slide 14 text

ナレッジベースの種類 1.Knowledge Base with Vector Store   ベクターストア型ナレッジベース 2.Knowledge Base with Structured Data Store   構造化データストア型ナレッジベース 3.Knowledge Base with Kendra GenAI Index   Amazon Kendra GenAIインデックス型ナレッジベース

Slide 15

Slide 15 text

ナレッジベースの種類 1.Knowledge Base with Vector Store   ベクターストア型ナレッジベース 2.Knowledge Base with Structured Data Store   構造化データストア型ナレッジベース 3.Knowledge Base with Kendra GenAI Index   Amazon Kendra GenAIインデックス型ナレッジベース

Slide 16

Slide 16 text

ナレッジベースの種類

Slide 17

Slide 17 text

ナレッジベースの種類

Slide 18

Slide 18 text

1.ベクターストア型ナレッジベース <概要> ・非構造化データ(例: テキスト文書やPDF)を扱う一般的なRAGアプローチ。 文書をベクトル表現に変換し類似検索で関連情報を取得することが出来る。 ・取り込み~分割~埋め込み生成~格納までの流れを自動処理するため、開発 者はデータソースを指定するだけで利用可能!

Slide 19

Slide 19 text

1.ベクターストア型ナレッジベース テキストの意味に基づく検索が可能になり、質問と表現が異なっても関連内容を 見つけ出せる。社内の様々な非構造データ(ドキュメント、ノート、Wiki等)に 横断的に対応可能で、LLMによる回答に社内文書のコンテキストを追加できる <ユースケース> ・社内ナレッジFAQボット ・製品マニュアルや技術文書のQA ・契約書やレポートの要約取得など ・社内ドキュメントを活用した質問応答全般

Slide 20

Slide 20 text

2.構造化データストア型ナレッジベース 1.Knowledge Base with Vector Store   ベクターストア型ナレッジベース 3.Knowledge Base with Kendra GenAI Index   Amazon Kendra GenAIインデックス型ナレッジベース 2.Knowledge Base with Structured Data Store   構造化データストア型ナレッジベース

Slide 21

Slide 21 text

2.構造化データストア型ナレッジベース

Slide 22

Slide 22 text

2.構造化データストア型ナレッジベース <概要> 構造化データ(テーブルやデータベースのレコード)に対する質問に、該当デー タをクエリで取り出して回答に利用するアプローチ。自然言語の質問をデータ ベース問い合わせ(SQL)に変換して実行し、結果を取得することが出来る。

Slide 23

Slide 23 text

2.構造化データストア型ナレッジベース <ユースケース> 構造化データに基づくQ&Aシナリオ系に適している ・ビジネス指標や社内システムの問い合わせ (例:「●●の今月の売上は?」、「○○の在庫数はいくつ?」など)。 ・社内のBI/分析データ ・顧客データベース ・在庫・取引記録の問い合わせ対応など

Slide 24

Slide 24 text

3.Amazon Kendra GenAIインデックス型ナレッジベース 1.Knowledge Base with Vector Store   ベクターストア型ナレッジベース 2.Knowledge Base with Structured Data Store   構造化データストア型ナレッジベース 3.Knowledge Base with Kendra GenAI Index   Amazon Kendra GenAIインデックス型ナレッジベース

Slide 25

Slide 25 text

3.Amazon Kendra GenAIインデックス型ナレッジベース

Slide 26

Slide 26 text

3.Amazon Kendra GenAIインデックス型ナレッジベース <概要> Amazon Kendra をLLM向けの情報検索に利用するアプローチ。 Kendraに社内ドキュメントをインデックスし、Bedrock Knowledge Baseがそ のインデックスに対して検索を行います。

Slide 27

Slide 27 text

3.Amazon Kendra GenAIインデックス型ナレッジベース <Kendraとは?> Amazon Kendraは、機械学習を活用したエンタープライズ検索サービスです。 Amazon Kendraを利用することで、Amazon S3 バケットやAmazon RDS等 様々な場所に存在するデータやドキュメントから、必要な情報を効率的に検索 することが可能になります。

Slide 28

Slide 28 text

3.Amazon Kendra GenAIインデックス型ナレッジベース <ユースケース> 大量の社内ドキュメントを扱う場合や、データソースが多岐にわたる場合など (ファイルサーバ、SharePoint、社内Wiki、チケットシステム等に分散した情 報)。 既に社内検索でKendraを導入済みで、そのインデックスを生成AIにも活用した いケースの時につかえる

Slide 29

Slide 29 text

まとめ

Slide 30

Slide 30 text

4.まとめ Amazon Bedrock Knowledge Base により、企業のデータを組み込んだ生成AIアプリケーショ ンを簡潔に構築可能。データの形態や目的に合わせ、「ベクターストア」「構造化DB」 「Kendraインデックス」の3つの方法を選択できる。 1.ベクターストア
 社内の非構造テキストから有用情報をベクトル検索で取得し、LLMの回答に反映。ドキュメントQAに最適 
 2.構造化データ
 社内DBの最新データを直接参照して回答を生成。社内数値レポートや事実質問に有効 
 3.Kendra
 企業向け検索基盤とLLMを統合。大規模・多様な文書セットを扱う高度なQAシステムに適する

Slide 31

Slide 31 text

Thank You!