Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon S3 Vectorsを使って低コストRAGを組んでみる
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NRI Netcom
PRO
August 25, 2025
Technology
230
7
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon S3 Vectorsを使って低コストRAGを組んでみる
NRI Netcom
PRO
August 25, 2025
More Decks by NRI Netcom
See All by NRI Netcom
AWSマンスリーアップデートピックアップ 2026年5月分
nrinetcom
PRO
0
70
Keynoteから考える、AIエージェント時代で何が変わるのか?
nrinetcom
PRO
0
77
「Google Cloud Next '26」で発表された、BigQueryの最新機能を使ってみよう
nrinetcom
PRO
0
74
Gemini Code AssistとGeminiCLIの活用例
nrinetcom
PRO
0
68
AI時代に求められる思考のパラダイムシフト
nrinetcom
PRO
1
190
ジュニアエンジニアはSREとどう向き合うべきか
nrinetcom
PRO
1
160
AWS認定資格は本当に意味があるのか?
nrinetcom
PRO
7
5.7k
AWSマンスリーアップデートピックアップ 2026年3月分
nrinetcom
PRO
0
99
昔話で振り返るAWSの歩み ~S3誕生から20年、クラウドはどう進化したのか~
nrinetcom
PRO
0
260
Other Decks in Technology
See All in Technology
非エンジニアがClaudeと挑んだ「1ヶ月間プロダクト30本ノック」
askokc
0
550
小さく始める AI 活用推進 ― 日経電子版 Web チームの事例/nikkei-tech-talk47
nikkei_engineer_recruiting
0
270
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
110
アジャイルな経理と Claude Code と経営の未来
kawaguti
PRO
3
110
ルールやカスタム機能、どう活かす?ハンズオンで体感するIBM Bobの出力コントロール
muehara
1
170
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
130
中期計画、2回作ってみた ~業務委託と正社員、両方の視点から~
demaecan
1
880
やさしいA2A入門
minorun365
PRO
12
1.9k
【セミナー資料】Claude Code をセキュアに使うための考え方と設定の勘どころ / Claude Code Webinar 20260616
masahirokawahara
2
360
現地で盛り上がった WWDC26 Keynote
zozotech
PRO
1
250
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
130
フィジカル版Github Onshapeの紹介
shiba_8ro
0
260
Featured
See All Featured
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
How to make the Groovebox
asonas
2
2.2k
Skip the Path - Find Your Career Trail
mkilby
1
150
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
Optimizing for Happiness
mojombo
378
71k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
200
The SEO identity crisis: Don't let AI make you average
varn
0
490
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
720
Between Models and Reality
mayunak
4
340
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
410
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
300
Transcript
Amazon S3 Vectorsを使って 低コストRAGを組んでみる ~NRIネットコム TECH & DESIGN STUDY #75~
2025年08月19日 NRIネットコム株式会社 Webインテグレーション事業部 梅原 航
1 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 基本情報
⚫ 梅原 航(うめはら こう) ⚫ NRIネットコム株式会社 Webインテグレーション事業部(大阪) ⚫ AWSを使ったシステムのインフラ開発・運用に従事 ◼ 受賞歴 ⚫ 2024 Japan AWS Jr. Champion ⚫ 2025 Japan All AWS Certifications Engineer ◼ 好きなAWSサービス ◼ 本日お話すること ⚫ RAGの基礎的な内容 ⚫ Amazon S3 VectorsをRAGで使うメリット・デメリット 自己紹介 Amazon Elastic Container Service (Amazon ECS) #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
2 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 大量のデータを事前に学習させておくことで、自然言語のパターンを理解可能な機械学習モデル
◼ ユーザからの質問への回答を生成することが可能 ◼ 事前に学習されたもの以外は回答できない ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答はできない ⚫ 嘘を付く可能性がある(ハルシネーション) 大規模言語モデル(Large Language Model)とは 生成AIとは 何ですか? 生成AIとは、機械 学習を元に・・・ 大規模言語モデル 社内申請の 仕方を教えて ? GPT Amazon Nova Claude ︙ 大規模言語モデル #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
3 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 検索(Retrieval)によって、拡張(Augmented)された、生成(Generation)
◼ LLMが外部のドキュメントを検索した上で回答を生成する ⚫ クローズドな情報や最新情報、特定ドメインに特化した内容の回答も可能 ⚫ 根拠持った回答 ⚫ ハルシネーションの抑制 RAG(Retrieval Augmented Generation)とは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 大規模言語モデル 社内申請の 仕方を教えて 社内申請は 以下URLの・・・ 社内文書 検索 回答生成
4 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 検索フーズ ⚫ ①外部データを細切れにするチャンキング ⚫ ②自然言語を数値で扱えるようにベクトル化(エンベディング、埋め込み) ⚫ ③ユーザからの質問(プロンプト)に関連する外部文書の検索 #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ② ③
5 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ 「文書を検索するフェーズ」と「回答を生成する生成フェーズ」の2つ
◼ 生成フェーズ ⚫ ④検索フェーズで得た情報からユーザへの回答文を生成 RAGの仕組み ベクトルデータベース ドキュメント 大規模言語モデル 社内申請の 仕方を教えて ① チャンク チャンク チャンク ③ #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します 社内申請は 以下URLの・・・ ④ ②
6 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ Amazon
Bedrock Knowledge Basesで簡単にRAGを構築可能 ◼ ドキュメントの保存 ⚫ Amazon S3など ◼ 大規模言語モデルの利用 ⚫ Amazon Bedrockで利用可能なモデル ⚫ Bedrockなのでプロンプトが再学習されない ◼ ベクトルデータの保存 ⚫ Amazon OpenSearch ⚫ Amazon Kendraなど AWSでRAGを利用するには Amazon S3 Amazon OpenSearch Service RetrieveAndGenerate API Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
7 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルを保存するデータベースのAWS利用料が高額
◼ 東京リージョンでの月額最低価格 ⚫ Amazon OpenSearch Serverless: 120.24 USD~ ⚫ Amazon Kendra: 810 USD~ AWSでRAGの欠点 Amazon S3 Amazon OpenSearch Service Model Amazon Bedrock Knowledge Bases #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
8 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトル検索の機能を持ったベクトルデータ保存用のオブジェクトストレージ
◼ S3がベースなオブジェクトストレージ ⚫ 耐久性がイレブンナイン(99.999999999%) ⚫ データ保存も無制限 ◼ 保存するデータ量による課金なので、ベクトルデータベースと比較して安価 ◼ ベクトルの保存や検索、メタデータ保存の機能が可能 ⚫ OpenSearchのようなハイブリッド検索や高度なフィルタリングといった機能はない ◼ コンソールにベクトルバケットの欄が追加 Amazon S3 Vectorsとは #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
9 Copyright(C) NRI Netcom, Ltd. All rights reserved. ◼ ベクトルデータベースの代用として、Amazon
S3 Vectorsを利用 ◼ メリット ⚫ ベクトル保存に対するコスト面が安くなる ◼ デメリット ⚫ レイテンシーの増加(1秒未満) ⚫ 検索性が弱い ◼ ユースケース ⚫ 性能よりコスト重視 ⚫ RAG機能をまずは試したい ⚫ 動画データなどデータ量が多いとき Amazon Bedrock Knowledge BasesでもS3 Vectorsを利用可能 Amazon S3 Model Amazon Bedrock Knowledge Bases Amazon S3 Vectors #nncstudy 転載、複製、改変等、および許諾のない二次利用を禁止します
None