Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Bedrock Knowledge Basesチャンキング解説!
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
野口碧生
February 01, 2026
Technology
0
450
Amazon Bedrock Knowledge Basesチャンキング解説!
野口碧生
February 01, 2026
Tweet
Share
Other Decks in Technology
See All in Technology
Claude Codeの進化と各機能の活かし方
oikon48
20
9.9k
ナレッジワーク IT情報系キャリア研究セッション資料(情報処理学会 第88回全国大会 )
kworkdev
PRO
0
110
プロジェクトマネジメントをチームに宿す -ゼロからはじめるチームプロジェクトマネジメントは活動1年未満のチームの教科書です- / 20260304 Shigeki Morizane
shift_evolve
PRO
1
140
kintone開発のプラットフォームエンジニアの紹介
cybozuinsideout
PRO
0
840
Agentic Software Modernization - Back to the Roots (Zürich Agentic Coding and Architectures, März 2026)
feststelltaste
1
220
Security Diaries of an Open Source IAM
ahus1
0
210
SaaSからAIへの過渡期の中で現在、組織内で起こっている変化 / SaaS to AI Paradigm Shift
aeonpeople
0
110
JAWS DAYS 2026 ExaWizards_20260307
exawizards
0
350
聲の形にみるアクセシビリティ
tomokusaba
0
150
オレ達はAWS管理をやりたいんじゃない!開発の生産性を爆アゲしたいんだ!!
wkm2
4
430
LINE Messengerの次世代ストレージ選定
lycorptech_jp
PRO
19
7.6k
AIエージェント・エコノミーの幕開け 〜 オープンプロトコルが変えるビジネスの未来 〜
shukob
0
110
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Being A Developer After 40
akosma
91
590k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
470
Abbi's Birthday
coloredviolet
2
5.2k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
SEO for Brand Visibility & Recognition
aleyda
0
4.3k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
120
Why Our Code Smells
bkeepers
PRO
340
58k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
250
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
140
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.4k
Transcript
Amazon Bedrock Knowledge Basesチャンキング解説! 標準戦略の使い分けとLambdaカスタムの境界線 発表者: 野口 碧生
豊洲会(1月) 自己紹介 2026/1/22 • AWS歴: 2年 • 好きなAWSサービス: Amazon Bedrock、
CDK • 最近の関心事: 野口 碧生 2025 Japan All Certifications Engineer • RAGの検索精度改善 • Advanced RAGの構築 1
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 2
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 3
豊洲会(1月) RAGの全体像とチャンキングの位置付け 2026/1/22 Documents Chunking Embedding Vector DB Retrieval LLM
(Generation) チャンキングは 「検索の質」 を決定づける最上流工程 不適切なチャンク = Garbage In, Garbage Out 4
豊洲会(1月) チャンキングが影響を与える4つの要素 2026/1/22 コスト(Cost) トークン数への影響 品質/精度(Quality) 文脈の維持 vs ノイズ レイテンシ(Latency)
検索・生成速度 UX 回答の的確さ Trade-Offs 5
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 6
豊洲会(1月) Amazon Bedrock Knowledge Bases 2026/1/22 基盤モデルと自社データソースを組み合わせた RAG(検索拡張生成)をフルマネージドに実現 https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2024_Amazon-Bedrock-Knowledge-Bases_0920_v1.pdf 7
豊洲会(1月) 戦略①デフォルト & ②固定サイズ(Fixed-size) 2026/1/22 ①デフォルト(約300トークン/文境界) ②固定サイズ(Fixed-size) 固定サイズの特徴:計算コスト◎ / 挙動予測◎
/ 文脈分断リスク△ 8
豊洲会(1月) 戦略③階層的チャンキング(Hierarchical) 2026/1/22 Parent Chunk(Large) Child Chunks (Small) Child Chunks
(Small) Child Chunks (Small) Child Chunks (Small) Child Chunks (Small) LLM 検索は 「子」 で行い、LLMには 「親」 を渡すことで文脈を維持 9
豊洲会(1月) 戦略④セマンティック & ⑤チャンキングなし 2026/1/22 ④セマンティック(意味の類似度で分割) ⑤チャンキングなし(1ファイル=1チャンク) 高精度だが推論コスト増 前処理済みデータ/FAQ向け 10
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 11
豊洲会(1月) Bedrock KB チャンキング戦略比較マトリクス 2026/1/22 戦略 コスト 精度 複雑さ 推奨ユースケース
デフォルト ◦ ◦ 低 汎用的なスタート地点 固定サイズ ◎ △ 低 一般文書 / PoC / 速度優先 階層的 ◦ ◎ 中 文脈が必要な文書 セマンティック △ ◎ 中 複雑な論文 / 契約書 なし ◎ - 低 加工済みデータ / FAQ 12
豊洲会(1月) 本日のLTで伝えたいこと 2026/1/22 1. 2. 3. RAGにおける チャンキングの重要性 4. Bedrock
KBの 全5つの戦略 戦略比較マトリクス (精度 vs コスト) Lambdaを使った カスタム実装 13
豊洲会(1月) カスタムチャンキング(Lambda関数) 2026/1/22 Source S3 ・標準戦略で対応できない特殊要件向け ・任意のロジック(正規表現、外部API等)を実装可能 Bedrock Knowledge Bases
Lambda (Custom Logic) Vector Database 14
豊洲会(1月) カスタムチャンキングの活用ユースケース 2026/1/22 コード ( ) 特殊フォーマット (特定 のみ )
( ルール) タデータ付与 (ファイル ) Lambda 15
豊洲会(1月) どの戦略を選ぶべきか? 2026/1/22 Start 独自の前処理済み? No chunking 特殊フォーマット (Code /
Markdown)? コスト・速度最優先? Custom (Lambda) Fixed-size 複雑な文脈理解 必要? Hierarchical / Semantic Default ★Recommended Starting Point Yes Yes Yes Yes No No No No 16
豊洲会(1月) まとめ 2026/1/22 チャンキングは RAG の 「検索精度」 と 「コスト」 を左右する
Bedrock KB は5つの戦略を提供(デフォルト、固定、階層、意味的、なし) カスタムチャンキングにより、特殊要件にも対応可能 まずは デフォルト でベースラインを作り、評価(Evaluation)しながら 最適化する 17