Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20240615_LT_RAG機能について_.pdf
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
木村直紀
June 15, 2024
0
91
20240615_LT_RAG機能について_.pdf
木村直紀
June 15, 2024
Tweet
Share
More Decks by 木村直紀
See All by 木村直紀
JAWS FESTA 2025でリリースしたほぼリアルタイム文字起こし/翻訳機能の構成について
naoki8408
1
1.2k
CodeCatalystでCDKのワークフローを簡単に作ろう!
naoki8408
0
16
20240908_共に歩む_Terraformと.pdf
naoki8408
0
13
Featured
See All Featured
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.5k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Faster Mobile Websites
deanohume
310
31k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.4k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.4k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
64
53k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
490
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
250
Everyday Curiosity
cassininazir
0
180
Chasing Engaging Ingredients in Design
codingconduct
0
150
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.5k
Transcript
AWSでRAG機能の開発? Amazon Bedrock for knowledgebaseを使ったRAG開発について
名前:木村 直紀 趣味:ランニング 筋トレ お酒 業務:AWS構築・保守運用 資格:AWS資格12冠 エンジニア歴:3年目 所属:株式会社ベンジャミン 好きなAWSサービス:AWSサポート
re:Inventって ご存知でしょうか?
re:Inventとは 毎年11月末にラスベガスで開催される AWS最大のカンファレンスイベントです。 →AWSの最新のアップデートが発表が行われます AWS CEOアダム・セリプスキー
昨年はAI元年
数多くのAIサービスが発表されました
今日はその発表の中にあった RAG機能について発表させていただきます
RAG機能とは? RAG (Retrieval-Augmented Generation (検索拡張生成)) は、 大規模言語モデル(LLM)によるテキスト生成に、 外部情報の検索を組み合わせることで、回答精度を向上させる技術のこと。 一般的でない情報や、最新の情報についてAIに質問すると、 AIは嘘をつく、ハルシネーションという現状が起こります。
これを特定のデータストアから情報を持ってくるようにすることで嘘を言わなくするような機能
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 そんな情報知らない ので、適当に答えよ 今日の天気は? 快晴だよ
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は?
Knowledge Base for Amazon Bedrock一般利用開始 ・基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に (RAGは、外部の知識ベースから事実を検索して、 最新の正確な情報に基づいて大規模言語モデル(LLM)に 回答を生成させることです)
• 基盤モデルとデータソースを組み合わせた拡張 検索生成(RAG)をフルマネージドに実現可能に • Amazon S3内に格納されたデータの場所を指定 するだけで、ベクトルDBにデータを取り込む ワークフローを実行 • バージニアとオレゴンで一般利用開始 天気の情報 今日の天気は? 台風が来るよ
嘘をほぼつかないChatGPT
すごい機能だ!
どうせお高いんでしょ?
残念ながらお高いです…
下記の構成で約月10万ほど…
ただ今回これを で作る構成を考えました!
やり方は簡単
DBをPineconeに変えるだけ
機能面の違いについて OpenSearch Serverless Pinecone コスト 約10万円/月 無料枠あり (無料枠だと1 indexのみ) 性能
ハイブリッド検索 (ベクトル検索+全文検索) ベクトル検索
https://ai-demo.bjm-tech.com/ 実際に作ったデモアプリを見てもらおうと思います 一般非公開なので画像だけ 貼らせていただきます
Amazon BedrockのKnowledge Baseを Pinecone無料枠で構築してみた 今回説明させていただいたRAGの作り方については下記URLよりご確認ください
6/20-21(来週 木、金)のAWS Summitにもブース出しますので、来られる方はぜひ!