Amazon Bedrock GenUハンズオン座学資料 #2 GenU環境でRAGを体験してみよう

by つくぼし

Slide 1

Slide 1 text

Amazon Bedrock GenUハンズオン座学資料 #2 GenU環境でRAGを体験してみよう 2025/3/24 Classmethod AI Talks

Slide 2

Slide 2 text

2 ⾃⼰紹介 ● 部署 ○ AWS事業本部コンサルティング部 ● ニックネーム ○ つくぼし ● 最近推しているAWSサービス ○ AWS Infrastructure Composer ● SNS/ブログ ○ X(@tsukuboshi0755) ○ DevelopersIO(つくぼし)

Slide 3

Slide 3 text

RAGとは

Slide 4

Slide 4 text

なぜRAGが必要なのか？ 4 ⚫ ⼀般業務で⽣成AIを活⽤したい場合、「社内ドキュメントに基づいて回答できるようにしたい」という要望が多い ⚫ RAGを構築し⽣成AIに使⽤させる事で、プライベートなドキュメントをクラウド上に格納しデータ同期するだけで、上記の要望を⽐較的簡単に実⾏できる

Slide 5

Slide 5 text

クイズ！ 5 RAGの正式名称はなんですか？

Slide 6

Slide 6 text

正解 6 RAG = Retrieval-Augmented Generation (検索拡張⽣成)

Slide 7

Slide 7 text

RAG（Retrieval-Augmented Generation）について 7 ⚫ ⽣成AIの回答精度を⾼めるため、外部知識ベースから関連情報を検索‧取得して活⽤する⼿法 ⚫ ハルシネーション(嘘)の軽減、専⾨分野での精度向上、企業固有情報の活⽤などのメリットがある参考：https://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/kb-how-it-works.html

Slide 8

Slide 8 text

AWSで使⽤できる代表的なRAGサービス Kendra 8 Bedrock Knowledge Bases ● ベクトルデータベースの選択肢はない(というか⾒えない) ● Kendra⾃体にRAG精度向上オプションは現状なく、⾃前実装が必要になりがち ● 豊富なSaaSコネクタを持つ ● メタデータやACLを⽤いた検索フィルタリングが利⽤可能 →ざっくりパラメータを設定してRAGの運⽤負荷を極⼒下げたい場合にオススメ ● ベクトルデータベースを様々な種類から選択可能 ● Knowlege Bases内で様々なRAG精度向上オプションを指定可能 ● ⼀部のSaaSコネクタなら対応 ● メタデータを⽤いた検索フィルタリングのみ利⽤可能 →細かくパラメータを設定してRAGの精度をより向上させたい場合にオススメ

Slide 9

Slide 9 text

KendraとKnowledge Basesの違いについてもっと知りたい⽅は... 9 こちらのブログがオススメです！ [Amazon Bedrock] RAG利⽤時の選択肢「Kendra」と「Bedrock Knowledge Bases」を⽐較する

Slide 10

Slide 10 text

RAGの精度向上

Slide 11

Slide 11 text

RAGを使うとこんな要望が多くなりがち 11 RAGの精度をなるべく⼿間かけず向上させたい！

Slide 12

Slide 12 text

その要望... 12 Bedrock Knowledge Bases を使えば解決できます！

Slide 13

Slide 13 text

Knowledge Basesの機能①：⾼度な解析(Advanced Parsing) 13 ⚫ 複雑な構造を持つドキュメントから精度⾼く情報を抽出‧理解する機能 ⚫ 表、グラフ、図表などの⾮テキスト要素や複雑なレイアウトを含むファイルから、⽂脈や関係性を保ったまま知識を取得できる。参照：https://qiita.com/kondo-k/items/1564c72540de3fb791d1

Slide 14

Slide 14 text

Knowledge Basesの機能②：チャンキング戦略(Chunking Strategy) 14 ⚫ ⼤量のテキストを意味のある⼩さな単位（チャンク）に変換する際に、⽂書の分割⽅法と重複の取り扱いを戦略的に定め、検索効率と回答精度を最適化する⼿法 ⚫ もしいじるならセマンティックチャンキング(⽂章の意味的なまとまりを保持)、または階層的チャンキング（⽂章の親⼦関係を保持）あたりがオススメ参照：https://medium.com/@vkrntkmrsngh/chunking-for-enhanced-llm-applications-e7a380b7889a

Slide 15

Slide 15 text

Knowledge Basesの機能③：リランキング(Reranking) 15 ⚫ 検索で取得した複数のチャンクを、クエリとの関連性や内容の質に基づいて再評価‧並べ替えする⾼度な機能 ⚫ 単純なベクトル類似度だけでなく、セマンティックな理解や⽂脈の関連性を考慮することで、より質の⾼い情報を優先的にRAGシステムに提供する。参照：https://cookbook.openai.com/examples/question_answering_using_a_search_api

Slide 16

Slide 16 text

No content