Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RAGでS3 Vectorを使おう
Search
八雲慎之助
July 26, 2025
1
200
RAGでS3 Vectorを使おう
【満員御礼】JAWS-UG 栃木 オフライン #3
八雲慎之助
July 26, 2025
Tweet
Share
More Decks by 八雲慎之助
See All by 八雲慎之助
BedrockでNL2SQLをやってみる
yakumo
1
55
Amazon Q CLI と MCPで Neptuneを自然言語で触ってみよう
yakumo
0
62
Amazon Neptune Graph Explorerのアプデについて
yakumo
0
100
Amazon Neptune で始めるグラフDB
yakumo
0
46
Knowledge BasesにRAGが対応しました!
yakumo
0
150
Jr.Championsになるための取り組みと期待すること
yakumo
1
250
2024年振り返り
yakumo
0
36
Neptune使ってみた
yakumo
0
52
AWS GameDayに参加してきた
yakumo
1
300
Featured
See All Featured
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
890
The Cost Of JavaScript in 2023
addyosmani
53
8.8k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.4k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
Raft: Consensus for Rubyists
vanstee
140
7.1k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.6k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.6k
Transcript
RAGでS3 Vectorを使おう
所属:株式会社クレスコ 好きなサービス:Amazon Neptune 年次:2年目 経歴: 2024年4月 株式会社クレスコ入社 2024年7月 ビジネスソリューション事業部配属 2025年6月
2025 Japan AWS Jr.Champion 名前:八雲 慎之助
None
None
None
None
• 埋め込みを利用 • 自然言語を機械が理解しやすい数値の羅列に変換 • ベクトルとして保存する https://aws.amazon.com/jp/what-is/embeddings-in-machine-learning/
None
None
None
https://aws.amazon.com/jp/blogs/aws/introducing-amazon-s3-vectors-first-cloud-storage-with- native-vector-support-at-scale/
• S3 Vector bucket • S3 Vector index
None
•ディメンション •距離メトリック •コサイン •ユークリッド
•ディメンション 利用する埋め込みモデルに合わせる必要あり 「Amazon Titan Text Embedding V2」だと 1024となる 高次元・・・精度が高いが、コスト高、 処理に時間
低次元・・・処理は軽いが、情報量が 減り正確性も不安
•距離メトリック •コサイン →ベクトルの「傾き」の近さを見る 意味ベースでの検索に強い •ユークリッド →ベクトルの距離を見る データのばらつきがないと 安定した比較ができる
None
• 圧倒的なコスト削減 →約90%削減 →コストは基本的にS3ベース.. 課金されるのはストレージくらい • Amazon OpenSearch Service との連携
→S3 Vectorからエクスポートが可能 →検索速度はOpenSearch Service の方が有利 S3 Vector 1秒程度 OpenSearch Service 数ミリ秒で完了
正確性 忠実性 有用性 完全性
正確性 忠実性 有用性 完全性
① ②
None
None
None
• S3 Vector は圧倒的コスパナレッジベース! • 約9割削減 • RAG評価もそこまで悪くない! • OpenSearch
Serverlssとの使い分け • コスト重視、たまにしか参照しない • 頻繁に参照、レスポンスも重視したい • S3 VectorからOpenSearch Serverlssへの移行も可能