Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Bedrock Knowledge Basesチャンキング解説!
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
野口碧生
February 01, 2026
Technology
1.7k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Amazon Bedrock Knowledge Basesチャンキング解説!
野口碧生
February 01, 2026
Other Decks in Technology
See All in Technology
コミュニティの有益性 ~JAWS Days 2026 での体験を通して~ / The Benefits of a Community ~Through My Experience at JAWS Days 2026~
seike460
PRO
0
300
攻撃者がいなくてもAIエージェントはインシデントを起こす
nomizone
0
130
BPaaSで進むAIオペレーションの現在地 AI実装が効く領域とスケーラビリティの選定と実装
kentarofujii
0
210
AIをフル活用してオンコール機能のプロトタイプを2日で作った話 / Building an AI-Powered On-Call Prototype in Just Two Days
nari_ex
0
140
AIエージェントとPhysical AIが拓く製造業の変革(ハノーバーメッセリキャップ)
iotcomjpadmin
0
160
ぼっちではじめた登壇が「51名」「241件」の発信に化けた
subroh0508
1
330
アラート調査向けAIエージェントの本番導入とその後/AI Agents for Alert Investigation: Production Deployment and After
taddy_919
1
240
AIは、人間らしい仕事の夢を見るか?─ AI時代のtoB/toEプロダクトを再設計する
techtekt
PRO
0
160
從觀望到全公司落地:AI Agentic Coding 導入實戰 — 流程整合與安全治理
appleboy
0
160
AIAU_UMEMOGU_ninomiya_slide
ninomiya_ii
0
280
AI時代における最適なQA組織の作り方
ymty
3
150
元・セキュリティ学習経験0大学生による業務紹介 / An Introduction to the Job by a Former College Student with Zero Security Training Experience
nttcom
0
910
Featured
See All Featured
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
240
Agile that works and the tools we love
rasmusluckow
331
22k
HDC tutorial
michielstock
2
720
WENDY [Excerpt]
tessaabrams
11
38k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
330
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
Accessibility Awareness
sabderemane
1
140
Being A Developer After 40
akosma
91
590k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
480
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
240
The SEO identity crisis: Don't let AI make you average
varn
0
500
Transcript
Amazon Bedrock Knowledge Basesチャンキング解説! 標準戦略の使い分けとLambdaカスタムの境界線 発表者: 野口 碧生
豊洲会(1月) 自己紹介 2026/1/22 • AWS歴: 2年 • 好きなAWSサービス: Amazon Bedrock、
CDK • 最近の関心事: 野口 碧生 2025 Japan All Certifications Engineer • RAGの検索精度改善 • Advanced RAGの構築 1
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 2
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 3
豊洲会(1月) RAGの全体像とチャンキングの位置付け 2026/1/22 Documents Chunking Embedding Vector DB Retrieval LLM
(Generation) チャンキングは 「検索の質」 を決定づける最上流工程 不適切なチャンク = Garbage In, Garbage Out 4
豊洲会(1月) チャンキングが影響を与える4つの要素 2026/1/22 コスト(Cost) トークン数への影響 品質/精度(Quality) 文脈の維持 vs ノイズ レイテンシ(Latency)
検索・生成速度 UX 回答の的確さ Trade-Offs 5
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 6
豊洲会(1月) Amazon Bedrock Knowledge Bases 2026/1/22 基盤モデルと自社データソースを組み合わせた RAG(検索拡張生成)をフルマネージドに実現 https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2024_Amazon-Bedrock-Knowledge-Bases_0920_v1.pdf 7
豊洲会(1月) 戦略①デフォルト & ②固定サイズ(Fixed-size) 2026/1/22 ①デフォルト(約300トークン/文境界) ②固定サイズ(Fixed-size) 固定サイズの特徴:計算コスト◎ / 挙動予測◎
/ 文脈分断リスク△ 8
豊洲会(1月) 戦略③階層的チャンキング(Hierarchical) 2026/1/22 Parent Chunk(Large) Child Chunks (Small) Child Chunks
(Small) Child Chunks (Small) Child Chunks (Small) Child Chunks (Small) LLM 検索は 「子」 で行い、LLMには 「親」 を渡すことで文脈を維持 9
豊洲会(1月) 戦略④セマンティック & ⑤チャンキングなし 2026/1/22 ④セマンティック(意味の類似度で分割) ⑤チャンキングなし(1ファイル=1チャンク) 高精度だが推論コスト増 前処理済みデータ/FAQ向け 10
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 11
豊洲会(1月) Bedrock KB チャンキング戦略比較マトリクス 2026/1/22 戦略 コスト 精度 複雑さ 推奨ユースケース
デフォルト ◦ ◦ 低 汎用的なスタート地点 固定サイズ ◎ △ 低 一般文書 / PoC / 速度優先 階層的 ◦ ◎ 中 文脈が必要な文書 セマンティック △ ◎ 中 複雑な論文 / 契約書 なし ◎ - 低 加工済みデータ / FAQ 12
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 13
豊洲会(1月) カスタムチャンキング(Lambda関数) 2026/1/22 Source S3 ・標準戦略で対応できない特殊要件向け ・任意のロジック(正規表現、外部API等)を実装可能 Bedrock Knowledge Bases
Lambda (Custom Logic) Vector Database 14
豊洲会(1月) カスタムチャンキングの活用ユースケース 2026/1/22 コード ( ) 特殊フォーマット (特定 のみ )
( ルール) タデータ付与 (ファイル ) Lambda 15
豊洲会(1月) どの戦略を選ぶべきか? 2026/1/22 Start 独自の前処理済み? No chunking 特殊フォーマット (Code /
Markdown)? コスト・速度最優先? Custom (Lambda) Fixed-size 複雑な文脈理解 必要? Hierarchical / Semantic Default ★Recommended Starting Point Yes Yes Yes Yes No No No No 16
豊洲会(1月) まとめ 2026/1/22 チャンキングは RAG の 「検索精度」 と 「コスト」 を左右する
Bedrock KB は5つの戦略を提供(デフォルト、固定、階層、意味的、なし) カスタムチャンキングにより、特殊要件にも対応可能 まずは デフォルト でベースラインを作り、評価(Evaluation)しながら 最適化する 17