Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20240615_LT_RAG機能について_.pdf
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
木村直紀
June 15, 2024
0
88
20240615_LT_RAG機能について_.pdf
木村直紀
June 15, 2024
Tweet
Share
More Decks by 木村直紀
See All by 木村直紀
JAWS FESTA 2025でリリースしたほぼリアルタイム文字起こし/翻訳機能の構成について
naoki8408
1
93
CodeCatalystでCDKのワークフローを簡単に作ろう!
naoki8408
0
8
20240908_共に歩む_Terraformと.pdf
naoki8408
0
7
Featured
See All Featured
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
260
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
240
Paper Plane
katiecoart
PRO
0
47k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
190
For a Future-Friendly Web
brad_frost
183
10k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
230
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
67
Mind Mapping
helmedeiros
PRO
1
110
Abbi's Birthday
coloredviolet
2
5.2k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.8k
Documentation Writing (for coders)
carmenintech
77
5.3k
Transcript
AWSでRAG機能の開発? Amazon Bedrock for knowledgebaseを使ったRAG開発について
名前:木村 直紀 趣味:ランニング 筋トレ お酒 業務:AWS構築・保守運用 資格:AWS資格12冠 エンジニア歴:3年目 所属:株式会社ベンジャミン 好きなAWSサービス:AWSサポート
re:Inventって ご存知でしょうか?
re:Inventとは 毎年11月末にラスベガスで開催される AWS最大のカンファレンスイベントです。 →AWSの最新のアップデートが発表が行われます AWS CEOアダム・セリプスキー
昨年はAI元年
数多くのAIサービスが発表されました
今日はその発表の中にあった RAG機能について発表させていただきます
RAG機能とは? RAG (Retrieval-Augmented Generation (検索拡張生成)) は、 大規模言語モデル(LLM)によるテキスト生成に、 外部情報の検索を組み合わせることで、回答精度を向上させる技術のこと。 一般的でない情報や、最新の情報についてAIに質問すると、 AIは嘘をつく、ハルシネーションという現状が起こります。
これを特定のデータストアから情報を持ってくるようにすることで嘘を言わなくするような機能
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は? 快晴だよ
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は? 台風が来るよ
嘘をほぼつかないChatGPT
すごい機能だ!
どうせお高いんでしょ?
残念ながらお高いです…
下記の構成で約月10万ほど…
ただ今回これを で作る構成を考えました!
やり方は簡単
DBをPineconeに変えるだけ
機能面の違いについて OpenSearch Serverless Pinecone コスト 約10万円/月 無料枠あり (無料枠だと1 indexのみ) 性能
ハイブリッド検索 (ベクトル検索+全文検索) ベクトル検索
https://ai-demo.bjm-tech.com/ 実際に作ったデモアプリを見てもらおうと思います 一般非公開なので画像だけ 貼らせていただきます
Amazon BedrockのKnowledge Baseを Pinecone無料枠で構築してみた 今回説明させていただいたRAGの作り方については下記URLよりご確認ください
6/20-21(来週 木、金)のAWS Summitにもブース出しますので、来られる方はぜひ!