Slide 3
Slide 3 text
• Learned Sparse Retrieval (LSR)とは
データセットから単語の重要度を学習し利⽤するスパース検索
‒ 現在主流である転置インデックスベースの⼿法をそのまま利⽤可能
‒ 重要度の学習には BERT などの Transformer ベースのモデルを利⽤
‒ 代表的な⼿法: SPLADE, DeepCT, uniCOIL, TILDE, EPIC etc.
Learned Sparse Retrieval とは? 3
BM25 を LSR 的に考えると IDF を Query Encoder,
TF を Document Encoder と捉えられる
(LSR では重み付けを⾏う Encoder が Transformer)