Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGでS3 Vectorを使おう
Search
八雲慎之助
July 26, 2025
1
180
RAGでS3 Vectorを使おう
【満員御礼】JAWS-UG 栃木 オフライン #3
八雲慎之助
July 26, 2025
Tweet
Share
More Decks by 八雲慎之助
See All by 八雲慎之助
Amazon Q CLI と MCPで Neptuneを自然言語で触ってみよう
yakumo
0
60
Amazon Neptune Graph Explorerのアプデについて
yakumo
0
85
Amazon Neptune で始めるグラフDB
yakumo
0
44
Knowledge BasesにRAGが対応しました!
yakumo
0
150
Jr.Championsになるための取り組みと期待すること
yakumo
1
240
2024年振り返り
yakumo
0
35
Neptune使ってみた
yakumo
0
47
AWS GameDayに参加してきた
yakumo
1
300
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
Thoughts on Productivity
jonyablonski
69
4.8k
A Modern Web Designer's Workflow
chriscoyier
695
190k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.5k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
How GitHub (no longer) Works
holman
314
140k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
21
1.4k
The Language of Interfaces
destraynor
158
25k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
47
9.6k
Transcript
RAGでS3 Vectorを使おう
所属:株式会社クレスコ 好きなサービス:Amazon Neptune 年次:2年目 経歴: 2024年4月 株式会社クレスコ入社 2024年7月 ビジネスソリューション事業部配属 2025年6月
2025 Japan AWS Jr.Champion 名前:八雲 慎之助
None
None
None
None
• 埋め込みを利用 • 自然言語を機械が理解しやすい数値の羅列に変換 • ベクトルとして保存する https://aws.amazon.com/jp/what-is/embeddings-in-machine-learning/
None
None
None
https://aws.amazon.com/jp/blogs/aws/introducing-amazon-s3-vectors-first-cloud-storage-with- native-vector-support-at-scale/
• S3 Vector bucket • S3 Vector index
None
•ディメンション •距離メトリック •コサイン •ユークリッド
•ディメンション 利用する埋め込みモデルに合わせる必要あり 「Amazon Titan Text Embedding V2」だと 1024となる 高次元・・・精度が高いが、コスト高、 処理に時間
低次元・・・処理は軽いが、情報量が 減り正確性も不安
•距離メトリック •コサイン →ベクトルの「傾き」の近さを見る 意味ベースでの検索に強い •ユークリッド →ベクトルの距離を見る データのばらつきがないと 安定した比較ができる
None
• 圧倒的なコスト削減 →約90%削減 →コストは基本的にS3ベース.. 課金されるのはストレージくらい • Amazon OpenSearch Service との連携
→S3 Vectorからエクスポートが可能 →検索速度はOpenSearch Service の方が有利 S3 Vector 1秒程度 OpenSearch Service 数ミリ秒で完了
正確性 忠実性 有用性 完全性
正確性 忠実性 有用性 完全性
① ②
None
None
None
• S3 Vector は圧倒的コスパナレッジベース! • 約9割削減 • RAG評価もそこまで悪くない! • OpenSearch
Serverlssとの使い分け • コスト重視、たまにしか参照しない • 頻繁に参照、レスポンスも重視したい • S3 VectorからOpenSearch Serverlssへの移行も可能