Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon S3 Vectorsを使って低コストRAGを組んでみる
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
umehara
August 19, 2025
Technology
160
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon S3 Vectorsを使って低コストRAGを組んでみる
umehara
August 19, 2025
More Decks by umehara
See All by umehara
Infrastructure as Codeのはじめ方 ~NRIネットコム TECH AND DESIGN STUDY #93~
umekou
1
140
AWSサービスアップデート202507.pdf
umekou
0
100
AWSマンスリーアップデートピックアップ!! 2025年4月分
umekou
0
110
コンソールで学ぶ!AWS CodePipelineの機能とオプション
umekou
3
340
AWS Well-Architected Frameworkで学ぶAmazon ECSのセキュリティ対策
umekou
2
310
AWSサービスアップデート 2025/02
umekou
0
110
CloudWatch Container Insightsを使ったAmazon ECSのリソース監視
umekou
1
450
AWSサービスアップデート202412 re:Invent特別編
umekou
0
140
DDoS攻撃への対策できてますか?
umekou
0
40
Other Decks in Technology
See All in Technology
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
1.2k
【Cyber-sec+】経営層を"動かす"ための考え方
hssh2_bin
0
190
Claude Codeとのおしゃべりでセマンティックモデルの定義からダッシュボード作成まで完成させる
nic_sugiyama
0
120
新しいUbuntu/GNOMEが使いたいからXからWaylandへ移行頑張ってるの巻 2026-06-20
nobutomurata
0
140
非エンジニアがClaudeと挑んだ「1ヶ月間プロダクト30本ノック」
askokc
0
610
中期計画、2回作ってみた ~業務委託と正社員、両方の視点から~
demaecan
1
910
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
270
自宅LLMの話
jacopen
1
600
フィジカル版Github Onshapeの紹介
shiba_8ro
0
270
入門!AWS Blocks
ysuzuki
1
140
Claude Code の Sandbox 機能を Anthropic Sandbox Runtime(srt) で試そう!/lets-play-anthropic-sandbox-runtime
tomoki10
1
620
失敗を資産に変えるClaude Code
shinyasaita
0
690
Featured
See All Featured
AI: The stuff that nobody shows you
jnunemaker
PRO
8
720
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
Documentation Writing (for coders)
carmenintech
77
5.4k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
560
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
350
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
Practical Orchestrator
shlominoach
191
11k
Balancing Empowerment & Direction
lara
6
1.2k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
200
Transcript
Amazon S3 Vectorsを使って 低コストRAGを組んでみる ~NRIネットコム TECH & DESIGN STUDY #75~
2025年08月19日 NRIネットコム株式会社 Webインテグレーション事業部 梅原 航
1 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 基本情報
⚫ 梅原 航(うめはら こう) ⚫ NRIネットコム株式会社 Webインテグレーション事業部(大阪) ⚫ AWSを使ったシステムのインフラ開発・運用に従事 ◼ 受賞歴 ⚫ 2024 Japan AWS Jr. Champion ⚫ 2025 Japan All AWS Certifications Engineer ◼ 好きなAWSサービス ◼ 本日お話すること ⚫ RAGの基礎的な内容 ⚫ Amazon S3 VectorsをRAGで使うメリット・デメリット 自己紹介 Amazon Elastic Container Service (Amazon ECS) #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
2 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 大量のデータを事前に学習させておくことで、自然言語のパターンを理解可能な機械学習モデル
◼ ユーザからの質問への回答を生成することが可能 ◼ 事前に学習されたもの以外は回答できない ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答はできない ⚫ 嘘を付く可能性がある(ハルシネーション) 大規模言語モデル(Large Language Model)とは 生成AIとは 何ですか? 生成AIとは、機械 学習を元に・・・ 大規模言語モデル 社内申請の 仕方を教えて ? GPT Amazon Nova Claude ︙ 大規模言語モデル #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
3 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 検索(Retrieval)によって、拡張(Augmented)された、生成(Generation)
◼ LLMが外部のドキュメントを検索した上で回答を生成する ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答も可能 ⚫ 根拠持った回答 ⚫ ハルシネーションの抑制 RAG(Retrieval Augmented Generation)とは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 大規模言語モデル 社内申請の 仕方を教えて 社内申請は 以下URLの・・・ 社内文書 検索 回答生成
4 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 検索フーズ ⚫ ①外部データを細切れにするチャンキング ⚫ ②自然言語を数値で扱えるようにベクトル化(エンベディング、埋め込み) ⚫ ③ユーザからの質問(プロンプト)に関連する外部文書の検索 #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ② ③
5 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 生成フェーズ ⚫ ④検索フェーズで得た情報からユーザへの回答文を生成 RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ③ #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 社内申請は 以下URLの・・・ ④ ②
6 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ Amazon
Bedrock Knowledge Basesで簡単にRAGを構築可能 ◼ ドキュメントの保存 ⚫ Amazon S3など ◼ 大規模言語モデルの利用 ⚫ Amazon Bedrockで利用可能なモデル ⚫ Bedrockなのでプロンプトが再学習されない ◼ ベクトルデータの保存 ⚫ Amazon OpenSearch ⚫ Amazon Kendraなど AWSでRAGを利用するには Amazon S3 Amazon OpenSearch Service RetrieveAndGenerate API Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
7 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルを保存するデータベースのAWS利用料が高額
◼ 東京リージョンでの月額最低価格 ⚫ Amazon OpenSearch Serverless: 120.24 USD~ ⚫ Amazon Kendra: 810 USD~ AWSでRAGの欠点 Amazon S3 Amazon OpenSearch Service Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
8 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトル検索の機能を持ったベクトルデータ保存用のオブジェクトストレージ
◼ S3がベースなオブジェクトストレージ ⚫ 耐久性がイレブンナイン(99.999999999%) ⚫ データ保存も無制限 ◼ 保存するデータ量による課金なので、ベクトルデータベースと比較して安価 ◼ ベクトルの保存や検索、メタデータ保存の機能が可能 ⚫ OpenSearchのようなハイブリッド検索や高度なフィルタリングといった機能はない ◼ コンソールにベクトルバケットの欄が追加 Amazon S3 Vectorsとは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
9 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルデータベースの代用として、Amazon
S3 Vectorsを利用 ◼ メリット ⚫ ベクトル保存に対するコスト面が安くなる ◼ デメリット ⚫ レイテンシーの増加(1秒未満) ⚫ 検索性が弱い ◼ ユースケース ⚫ 性能よりコスト重視 ⚫ RAG機能をまずは試したい ⚫ 動画データなどデータ量が多いとき Amazon Bedrock Knowledge BasesでもS3 Vectorsを利用可能 Amazon S3 Model Amazon Bedrock Knowledge Bases Amazon S3 Vectors #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
None