Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20240615_LT_RAG機能について_.pdf
Search
木村直紀
June 15, 2024
0
91
20240615_LT_RAG機能について_.pdf
木村直紀
June 15, 2024
Tweet
Share
More Decks by 木村直紀
See All by 木村直紀
JAWS FESTA 2025でリリースしたほぼリアルタイム文字起こし/翻訳機能の構成について
naoki8408
1
1.2k
CodeCatalystでCDKのワークフローを簡単に作ろう!
naoki8408
0
16
20240908_共に歩む_Terraformと.pdf
naoki8408
0
13
Featured
See All Featured
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
130
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
150
RailsConf 2023
tenderlove
30
1.4k
Visualization
eitanlees
150
17k
A Modern Web Designer's Workflow
chriscoyier
698
190k
The agentic SEO stack - context over prompts
schlessera
0
720
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Scaling GitHub
holman
464
140k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.1k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
330
4 Signs Your Business is Dying
shpigford
187
22k
Bash Introduction
62gerente
615
210k
Transcript
AWSでRAG機能の開発? Amazon Bedrock for knowledgebaseを使ったRAG開発について
名前:木村 直紀 趣味:ランニング 筋トレ お酒 業務:AWS構築・保守運用 資格:AWS資格12冠 エンジニア歴:3年目 所属:株式会社ベンジャミン 好きなAWSサービス:AWSサポート
re:Inventって ご存知でしょうか?
re:Inventとは 毎年11月末にラスベガスで開催される AWS最大のカンファレンスイベントです。 →AWSの最新のアップデートが発表が行われます AWS CEOアダム・セリプスキー
昨年はAI元年
数多くのAIサービスが発表されました
今日はその発表の中にあった RAG機能について発表させていただきます
RAG機能とは? RAG (Retrieval-Augmented Generation (検索拡張生成)) は、 大規模言語モデル(LLM)によるテキスト生成に、 外部情報の検索を組み合わせることで、回答精度を向上させる技術のこと。 一般的でない情報や、最新の情報についてAIに質問すると、 AIは嘘をつく、ハルシネーションという現状が起こります。
これを特定のデータストアから情報を持ってくるようにすることで嘘を言わなくするような機能
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は? 快晴だよ
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は? 台風が来るよ
嘘をほぼつかないChatGPT
すごい機能だ!
どうせお高いんでしょ?
残念ながらお高いです…
下記の構成で約月10万ほど…
ただ今回これを で作る構成を考えました!
やり方は簡単
DBをPineconeに変えるだけ
機能面の違いについて OpenSearch Serverless Pinecone コスト 約10万円/月 無料枠あり (無料枠だと1 indexのみ) 性能
ハイブリッド検索 (ベクトル検索+全文検索) ベクトル検索
https://ai-demo.bjm-tech.com/ 実際に作ったデモアプリを見てもらおうと思います 一般非公開なので画像だけ 貼らせていただきます
Amazon BedrockのKnowledge Baseを Pinecone無料枠で構築してみた 今回説明させていただいたRAGの作り方については下記URLよりご確認ください
6/20-21(来週 木、金)のAWS Summitにもブース出しますので、来られる方はぜひ!