Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Bedrock Knowledge Basesチャンキング解説!
Search
野口碧生
February 01, 2026
Technology
0
390
Amazon Bedrock Knowledge Basesチャンキング解説!
野口碧生
February 01, 2026
Tweet
Share
Other Decks in Technology
See All in Technology
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1.1k
Oracle Cloud Infrastructure:2026年2月度サービス・アップデート
oracle4engineer
PRO
0
220
Serverless Agent Architecture on Azure / serverless-agent-on-azure
miyake
1
150
EMからICへ、二周目人材としてAI全振りのプロダクト開発で見つけた武器
yug1224
3
380
Oracle Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
5
1.1k
パネルディスカッション資料 (at Tableau Now! - 2026-02-26)
yoshitakaarakawa
0
1.1k
クラウド時代における一時権限取得
krrrr38
1
160
Kaggleで鍛えたスキルの実務での活かし方 競技とプロダクト開発のリアル
recruitengineers
PRO
1
140
チームメンバー迷わないIaC設計
hayama17
5
3.8k
Kaggleの経験が実務にどう活きているか / kaggle_findy
sansan_randd
4
730
OSSで構築するIT基盤管理実践事例: NetBox・Snipe-IT・FreeRADIUS+PrivacyIDEA / Practical Case Studies of IT Infrastructure Management Using OSS
nttcom
0
200
JAWS DAYS 2026 CDP道場 事前説明会 / JAWS DAYS 2026 CDP Dojo briefing document
naospon
0
140
Featured
See All Featured
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
170
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.3k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
850
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
94
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
620
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
460
Building Adaptive Systems
keathley
44
2.9k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
Transcript
Amazon Bedrock Knowledge Basesチャンキング解説! 標準戦略の使い分けとLambdaカスタムの境界線 発表者: 野口 碧生
豊洲会(1月) 自己紹介 2026/1/22 • AWS歴: 2年 • 好きなAWSサービス: Amazon Bedrock、
CDK • 最近の関心事: 野口 碧生 2025 Japan All Certifications Engineer • RAGの検索精度改善 • Advanced RAGの構築 1
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 2
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 3
豊洲会(1月) RAGの全体像とチャンキングの位置付け 2026/1/22 Documents Chunking Embedding Vector DB Retrieval LLM
(Generation) チャンキングは 「検索の質」 を決定づける最上流工程 不適切なチャンク = Garbage In, Garbage Out 4
豊洲会(1月) チャンキングが影響を与える4つの要素 2026/1/22 コスト(Cost) トークン数への影響 品質/精度(Quality) 文脈の維持 vs ノイズ レイテンシ(Latency)
検索・生成速度 UX 回答の的確さ Trade-Offs 5
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 6
豊洲会(1月) Amazon Bedrock Knowledge Bases 2026/1/22 基盤モデルと自社データソースを組み合わせた RAG(検索拡張生成)をフルマネージドに実現 https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2024_Amazon-Bedrock-Knowledge-Bases_0920_v1.pdf 7
豊洲会(1月) 戦略①デフォルト & ②固定サイズ(Fixed-size) 2026/1/22 ①デフォルト(約300トークン/文境界) ②固定サイズ(Fixed-size) 固定サイズの特徴:計算コスト◎ / 挙動予測◎
/ 文脈分断リスク△ 8
豊洲会(1月) 戦略③階層的チャンキング(Hierarchical) 2026/1/22 Parent Chunk(Large) Child Chunks (Small) Child Chunks
(Small) Child Chunks (Small) Child Chunks (Small) Child Chunks (Small) LLM 検索は 「子」 で行い、LLMには 「親」 を渡すことで文脈を維持 9
豊洲会(1月) 戦略④セマンティック & ⑤チャンキングなし 2026/1/22 ④セマンティック(意味の類似度で分割) ⑤チャンキングなし(1ファイル=1チャンク) 高精度だが推論コスト増 前処理済みデータ/FAQ向け 10
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 11
豊洲会(1月) Bedrock KB チャンキング戦略比較マトリクス 2026/1/22 戦略 コスト 精度 複雑さ 推奨ユースケース
デフォルト ◦ ◦ 低 汎用的なスタート地点 固定サイズ ◎ △ 低 一般文書 / PoC / 速度優先 階層的 ◦ ◎ 中 文脈が必要な文書 セマンティック △ ◎ 中 複雑な論文 / 契約書 なし ◎ - 低 加工済みデータ / FAQ 12
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 13
豊洲会(1月) カスタムチャンキング(Lambda関数) 2026/1/22 Source S3 ・標準戦略で対応できない特殊要件向け ・任意のロジック(正規表現、外部API等)を実装可能 Bedrock Knowledge Bases
Lambda (Custom Logic) Vector Database 14
豊洲会(1月) カスタムチャンキングの活用ユースケース 2026/1/22 コード ( ) 特殊フォーマット (特定 のみ )
( ルール) タデータ付与 (ファイル ) Lambda 15
豊洲会(1月) どの戦略を選ぶべきか? 2026/1/22 Start 独自の前処理済み? No chunking 特殊フォーマット (Code /
Markdown)? コスト・速度最優先? Custom (Lambda) Fixed-size 複雑な文脈理解 必要? Hierarchical / Semantic Default ★Recommended Starting Point Yes Yes Yes Yes No No No No 16
豊洲会(1月) まとめ 2026/1/22 チャンキングは RAG の 「検索精度」 と 「コスト」 を左右する
Bedrock KB は5つの戦略を提供(デフォルト、固定、階層、意味的、なし) カスタムチャンキングにより、特殊要件にも対応可能 まずは デフォルト でベースラインを作り、評価(Evaluation)しながら 最適化する 17