Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bedrock素人がKnowledgeBaseでRAGを構築するまで
Search
wkm2
December 15, 2023
Technology
2
420
Bedrock素人がKnowledgeBaseでRAGを構築するまで
第32回 JAWS-UG札幌 勉強会 登壇資料
https://jawsug-sapporo.doorkeeper.jp/events/165768
wkm2
December 15, 2023
Tweet
Share
More Decks by wkm2
See All by wkm2
API叩くだけのLambdaを作るつもりがコンテナ on EC2になった話
wkm2
0
6
AWSネイティブなセキュリティを考える
wkm2
1
300
KAGが関わるアカウント全てにSecurity Hubを導入した(い)話
wkm2
0
180
地方在住フルリモートワークエンジニアのリアル 〜ジモトで_活きる_エンジニアライフ〜
wkm2
1
690
Keynote以外のアップデートピックアップ!
wkm2
1
130
EC2を再起動したいがためにNew Relicを使った話
wkm2
1
430
ネットワークサービスフル活用で実現するハイブリッド構成 〜コープさっぽろのネットワーク全体像〜
wkm2
2
2k
AWS SSO でログインを簡単に〜IAMユーザ管理をしたくない〜
wkm2
1
610
固定IPでLambdaにHTTPリクエストを投げる経路を試してみた
wkm2
1
900
Other Decks in Technology
See All in Technology
Service Monitoring Platformについて
lycorptech_jp
PRO
0
320
新しい風。SolidFlutterで実現するシンプルな状態管理
zozotech
PRO
0
130
はじめての OSS コントリビューション 〜小さな PR が世界を変える〜
chiroito
4
350
大規模モノレポの秩序管理 失速しない多言語化フロントエンドの運用 / JSConf JP 2025
shoota
0
290
巨大モノリスのリプレイス──機能整理とハイブリッドアーキテクチャで挑んだ再構築戦略
zozotech
PRO
0
230
不確実性に備える ABEMA の信頼性設計とオブザーバビリティ基盤
nagapad
3
4.9k
機密情報の漏洩を防げ! Webフロントエンド開発で意識すべき漏洩パターンとその対策
mizdra
PRO
14
5.1k
技術広報のOKRで生み出す 開発組織への価値 〜 カンファレンス協賛を通して育む学びの文化 〜 / Creating Value for Development Organisations Through Technical Communications OKRs — Nurturing a Culture of Learning Through Conference Sponsorship —
pauli
5
490
AI エージェントを評価するための温故知新と Spec Driven Evaluation
icoxfog417
PRO
2
580
なぜブラウザで帳票を生成したいのか どのようにブラウザで帳票を生成するのか
yagisanreports
0
150
DDD x Microservice Architecture : Findy Architecture Conf 2025
syobochim
12
3.2k
組織の“見えない壁”を越えよ!エンタープライズシフトに必須な3つのPMの「在り方」変革 #pmconf2025
masakazu178
1
620
Featured
See All Featured
Designing Experiences People Love
moore
142
24k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
KATA
mclloyd
PRO
32
15k
Practical Orchestrator
shlominoach
190
11k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
980
The Cult of Friendly URLs
andyhume
79
6.7k
The Cost Of JavaScript in 2023
addyosmani
55
9.3k
Making the Leap to Tech Lead
cromwellryan
135
9.6k
Rebuilding a faster, lazier Slack
samanthasiow
84
9.3k
How to Think Like a Performance Engineer
csswizardry
28
2.3k
Transcript
Bedrock素人が KnowledgeBaseでRAGを 構築するまで 第32回 JAWS-UG札幌 勉強会 KDDIアジャイル開発センター 若松剛志
Who am I ? 若松 剛志 AWS チョットデキル エンジニア @t_wkm2
re:Inventに自費で参加してきた
re:Inventの思い出
ハワイ最高だった
ハワイ最高だった • 照りつける太陽 • 初めてのサーフィン • ビーチバーでサンセットを見ながら煽る ゴールデンエール
ラスベガスとちゃうんかい!
トランジットです
時差ボケが無くてほんと最高です 約7時間 約6時間
時差ボケが無くてほんと最高です 羽田 11/23(木) 20:05 ホノルル 11/23(木) 8:05 ホノルル 11/23(木) 23:30
ラスベガス 11/24(金) 7:15 トランジット 15時間!! 飛行機で寝て 朝着く 飛行機で寝て 朝着く!!
実はこれ2回目
昨年のJAWS-UG札幌のお品書き ほんとはここで話すは ずだった
登壇者全員コロナ感染
今回は無事生還しました!
改めてre:Inventのお話
改めてre:Inventのお話 参加人数6万人、日本からは1700人 ラスベガスのホテル6つを会場にセッションを展開 現地でした味わえないGameDayへの参加や参加者との交流、EBCでの開発者との ディスカッション
Keynoteの振り返りを少しだけ
Peter DeSantis (Monday Night Live) • Amazon Aurora Limitless Database
• Amazon ElastiCache Serverless
Adam Selipsky • Amazon S3 Express One Zone • Bedrock関連
◦ Knowledge Base ◦ Fine-tuning and Continued Pre-training ◦ Agents ◦ Guardrails • Amazon Q • Zero-ETL ◦ Redshift ◦ DynamoDB ◦ OpenSearch Service
Swami Sivasubramanian • Bedrock ◦ Anthropic Claude 2.1 ◦ Meta
Llama 2 70B ◦ Amazon Titan ▪ Multimodal Embedding ▪ Titan Text Lite ▪ Titan Text Express ▪ Titan Image Generator • Vector search engine ◦ OpenSearch Service Serverless ◦ DocumentDB ◦ Amazon DynamoDB ◦ MemoryDB • Amazon Q ◦ Redshift ◦ AWS Glue
Dr. Werner Vogels • The Frugal Architecture ◦ https://thefrugalarchitect.com/ •
AWS Management Console myApplications • CloudWatch Application Signals • Application Composer in VS Code • Inspector CI/CD Container Scanning
本題
Bedrock素人がKnowledgeBaseで RAGを構築するまで
Amazon Bedrockとは AWSが提供する生成AIのサービス。 Bedrockそのものはモデルではなく、様々なモデルをサーバーレスにかつセキュアに運 用できるサービスとなっている。 使用できるモデルは以下(本日現在) • AI21 Labs -
Jurassic-2(Text)※ • Amazon - Titan(Text/Embedding) • Anthropic - Claude(Text) • Cohere - Command/Embed(Text/Embedding)※ • Stability AI - Stable Diffusion XL(Image)※ ※東京リージョン未対応
KnowledgeBaseとは 正式には KnowledgeBase for Bedrock Bedrockを用いてRAGを簡単に構築するサービス Bedrockで使える基礎モデルベースに、ベクトルデータベースの検索を使って拡張する
RAGとは 社内情報などの外部データソースを検索し、結果をプロンプトに含めて基礎モデルに投 げ込むことで、基礎モデルが知らない知識を回答させることができる 元々はハルシネーション(生成AIがもっともらしいウソを回答する)を防ぐことが目的だっ たが、ファインチューニングの代わりにも使用されるようになった 検索にはベクトルデータベースが用いられ、検索ワードに意味が近いものを返すセマン ティック検索が可能になる。
RAGとは ベクトル データベース RAGアプリ 基礎モデル プロンプトのワードをベ クトル化してセマンティッ ク検索 検索結果をプロンプトに 含めて生成AIへ投げて
回答を得る
KnowledgeBaseの場合 Cloudev2 OpenSearch Serverless Vector Store KnowledgeBase for Bedrock S3
外部知識を 置いておく Amazon Titan Embededing で ベクトル化して OpenSearchへ 同期
ほんとにできるか検証してみる
KnowledgeBase検証 S3に外部知識を置く
KnowledgeBase検証 モデル有効化
KnowledgeBase検証 KnowledgeBase作成
KnowledgeBase検証 S3指定
KnowledgeBase検証 ベクトルデータベース指定
5分くらい待つ
KnowledgeBase検証
あまりにも簡単にできちゃった
まとめ • KnowledgeBaseはRAGを構成するのに面倒なと ころを解消してくれる • ベクトルデータベースにOpenSearch Severless が立つのに注意