Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGでS3 Vectorを使おう
Search
やくも
July 26, 2025
1
330
RAGでS3 Vectorを使おう
【満員御礼】JAWS-UG 栃木 オフライン #3
やくも
July 26, 2025
Tweet
Share
More Decks by やくも
See All by やくも
AIエージェントを5分で一気におさらい!AIエージェント「構築」元年に備えよう
yakumo
1
130
AI時代のワークフロー設計〜Durable Functions / Step Functions / Strands Agents を添えて〜
yakumo
4
2.5k
AIの長期記憶と短期記憶の違いについてAgentCoreを例に深掘ってみた
yakumo
5
500
品川会立ち上げについて
yakumo
1
140
5分で体感するhuman-in-the-loop!AIに丸投げはもうやめよう!
yakumo
1
390
re:Inventで発表された新サービス~AgentCore Evaluations/Policy~
yakumo
2
290
効果的なAIエージェントを考える〜それホントにAIエージェントじゃなきゃだめですか?〜
yakumo
3
730
新米エンジニアがJapan AWS Jr.Championsになるまで〜ゼロから始めたAWSとの歩み〜
yakumo
2
320
グラフDBがチョットわかるようになる話
yakumo
5
500
Featured
See All Featured
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
Google's AI Overviews - The New Search
badams
0
880
エンジニアに許された特別な時間の終わり
watany
106
220k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
270
Facilitating Awesome Meetings
lara
57
6.7k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
How STYLIGHT went responsive
nonsquared
100
6k
Claude Code のすすめ
schroneko
67
210k
KATA
mclloyd
PRO
33
15k
Building Applications with DynamoDB
mza
96
6.9k
The SEO identity crisis: Don't let AI make you average
varn
0
40
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
100
Transcript
RAGでS3 Vectorを使おう
所属:株式会社クレスコ 好きなサービス:Amazon Neptune 年次:2年目 経歴: 2024年4月 株式会社クレスコ入社 2024年7月 ビジネスソリューション事業部配属 2025年6月
2025 Japan AWS Jr.Champion 名前:八雲 慎之助
None
None
None
None
• 埋め込みを利用 • 自然言語を機械が理解しやすい数値の羅列に変換 • ベクトルとして保存する https://aws.amazon.com/jp/what-is/embeddings-in-machine-learning/
None
None
None
https://aws.amazon.com/jp/blogs/aws/introducing-amazon-s3-vectors-first-cloud-storage-with- native-vector-support-at-scale/
• S3 Vector bucket • S3 Vector index
None
•ディメンション •距離メトリック •コサイン •ユークリッド
•ディメンション 利用する埋め込みモデルに合わせる必要あり 「Amazon Titan Text Embedding V2」だと 1024となる 高次元・・・精度が高いが、コスト高、 処理に時間
低次元・・・処理は軽いが、情報量が 減り正確性も不安
•距離メトリック •コサイン →ベクトルの「傾き」の近さを見る 意味ベースでの検索に強い •ユークリッド →ベクトルの距離を見る データのばらつきがないと 安定した比較ができる
None
• 圧倒的なコスト削減 →約90%削減 →コストは基本的にS3ベース.. 課金されるのはストレージくらい • Amazon OpenSearch Service との連携
→S3 Vectorからエクスポートが可能 →検索速度はOpenSearch Service の方が有利 S3 Vector 1秒程度 OpenSearch Service 数ミリ秒で完了
正確性 忠実性 有用性 完全性
正確性 忠実性 有用性 完全性
① ②
None
None
None
• S3 Vector は圧倒的コスパナレッジベース! • 約9割削減 • RAG評価もそこまで悪くない! • OpenSearch
Serverlssとの使い分け • コスト重視、たまにしか参照しない • 頻繁に参照、レスポンスも重視したい • S3 VectorからOpenSearch Serverlssへの移行も可能