Slide 5
Slide 5 text
解決への体系的アプローチ:3つの改善軸でボトルネックを特定
精度低下の要因を特定するため、以下の 3つの改善軸 に沿って複数の技術的な戦略を評価しまし
た。これにより、最も効果的な打ち手は何かをデータに基づき判断します。
データ
(Data)
チャンキング
(Chunking)
検索
(Retrieval)
生成
(Generation)
1. データ自体の最適化
(Data Preprocessing)
検索対象のドキュメント構造 そのもの
を改善できるか。
テスト項目:従業員種別ごと のドキュメ
ント分割
2. チャンキングの最適化
(Chunking Strategy)
テキストをどのように分割・保持する
か。
テスト項目:標準、大きめ、親子チャン
ク、HyDE(仮説的質問)
3.検索後処理の導入
(Post-Retrieval)
検索結果をどう絞り込み、順位付けす
るか。
テスト項目:クロスエンコーダーによる
再ランク付け