Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Bedrock Knowledge Basesチャンキング解説!
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
野口碧生
February 01, 2026
Technology
980
0
Share
Amazon Bedrock Knowledge Basesチャンキング解説!
野口碧生
February 01, 2026
Other Decks in Technology
See All in Technology
生成AIが変える SaaS の競争原理と弁護士ドットコムのプロダクト戦略
bengo4com
1
2.4k
AWS Agent Registry の基礎・概要を理解する/aws-agent-registry-intro
ren8k
3
410
GKE Agent SandboxでAIが生成したコードを 安全に実行してみた
lamaglama39
0
100
Rapid Start: Faster Internet Connections, with Ruby's Help
kazuho
2
810
Route 53 Global Resolver で高額課金発生!
otanikohei2023
0
130
Chasing Real-Time Observability for CRuby
whitegreen
0
280
プラットフォームエンジニアリングの実践 - AWS コンテナサービスで構築する社内プラットフォーム / AWS Containers Platform Meetup #1
literalice
1
210
AndroidアプリとCopilot Studioの統合
nakasho
0
170
コードや知識を組み込む / Incorporate Code and Knowledge
ks91
PRO
0
180
20260428_Product Management Summit_Loglass_JoeHirose
loglassjoe
3
4k
国内外の生成AIセキュリティの最新動向 & AIガードレール製品「chakoshi」のご紹介 / Latest Trends in Generative AI Security (Domestic & International) & Introduction to AI Guardrail Product "chakoshi"
nttcom
4
1.5k
ハーネスエンジニアリングをやりすぎた話 ~そのハーネスは解体された~
gotalab555
5
1.9k
Featured
See All Featured
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
280
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
180
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
440
The Invisible Side of Design
smashingmag
303
52k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.4k
Why Our Code Smells
bkeepers
PRO
340
58k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
The Curious Case for Waylosing
cassininazir
0
320
エンジニアに許された特別な時間の終わり
watany
106
240k
Leo the Paperboy
mayatellez
7
1.7k
Transcript
Amazon Bedrock Knowledge Basesチャンキング解説! 標準戦略の使い分けとLambdaカスタムの境界線 発表者: 野口 碧生
豊洲会(1月) 自己紹介 2026/1/22 • AWS歴: 2年 • 好きなAWSサービス: Amazon Bedrock、
CDK • 最近の関心事: 野口 碧生 2025 Japan All Certifications Engineer • RAGの検索精度改善 • Advanced RAGの構築 1
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 2
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 3
豊洲会(1月) RAGの全体像とチャンキングの位置付け 2026/1/22 Documents Chunking Embedding Vector DB Retrieval LLM
(Generation) チャンキングは 「検索の質」 を決定づける最上流工程 不適切なチャンク = Garbage In, Garbage Out 4
豊洲会(1月) チャンキングが影響を与える4つの要素 2026/1/22 コスト(Cost) トークン数への影響 品質/精度(Quality) 文脈の維持 vs ノイズ レイテンシ(Latency)
検索・生成速度 UX 回答の的確さ Trade-Offs 5
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 6
豊洲会(1月) Amazon Bedrock Knowledge Bases 2026/1/22 基盤モデルと自社データソースを組み合わせた RAG(検索拡張生成)をフルマネージドに実現 https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2024_Amazon-Bedrock-Knowledge-Bases_0920_v1.pdf 7
豊洲会(1月) 戦略①デフォルト & ②固定サイズ(Fixed-size) 2026/1/22 ①デフォルト(約300トークン/文境界) ②固定サイズ(Fixed-size) 固定サイズの特徴:計算コスト◎ / 挙動予測◎
/ 文脈分断リスク△ 8
豊洲会(1月) 戦略③階層的チャンキング(Hierarchical) 2026/1/22 Parent Chunk(Large) Child Chunks (Small) Child Chunks
(Small) Child Chunks (Small) Child Chunks (Small) Child Chunks (Small) LLM 検索は 「子」 で行い、LLMには 「親」 を渡すことで文脈を維持 9
豊洲会(1月) 戦略④セマンティック & ⑤チャンキングなし 2026/1/22 ④セマンティック(意味の類似度で分割) ⑤チャンキングなし(1ファイル=1チャンク) 高精度だが推論コスト増 前処理済みデータ/FAQ向け 10
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 11
豊洲会(1月) Bedrock KB チャンキング戦略比較マトリクス 2026/1/22 戦略 コスト 精度 複雑さ 推奨ユースケース
デフォルト ◦ ◦ 低 汎用的なスタート地点 固定サイズ ◎ △ 低 一般文書 / PoC / 速度優先 階層的 ◦ ◎ 中 文脈が必要な文書 セマンティック △ ◎ 中 複雑な論文 / 契約書 なし ◎ - 低 加工済みデータ / FAQ 12
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 13
豊洲会(1月) カスタムチャンキング(Lambda関数) 2026/1/22 Source S3 ・標準戦略で対応できない特殊要件向け ・任意のロジック(正規表現、外部API等)を実装可能 Bedrock Knowledge Bases
Lambda (Custom Logic) Vector Database 14
豊洲会(1月) カスタムチャンキングの活用ユースケース 2026/1/22 コード ( ) 特殊フォーマット (特定 のみ )
( ルール) タデータ付与 (ファイル ) Lambda 15
豊洲会(1月) どの戦略を選ぶべきか? 2026/1/22 Start 独自の前処理済み? No chunking 特殊フォーマット (Code /
Markdown)? コスト・速度最優先? Custom (Lambda) Fixed-size 複雑な文脈理解 必要? Hierarchical / Semantic Default ★Recommended Starting Point Yes Yes Yes Yes No No No No 16
豊洲会(1月) まとめ 2026/1/22 チャンキングは RAG の 「検索精度」 と 「コスト」 を左右する
Bedrock KB は5つの戦略を提供(デフォルト、固定、階層、意味的、なし) カスタムチャンキングにより、特殊要件にも対応可能 まずは デフォルト でベースラインを作り、評価(Evaluation)しながら 最適化する 17