Inromation Retrieval ALL figures which have no comment are from this paper or made by myself IR READING 2022 発表者 飯田 大貴(東工大岡崎研/レトリバ) Thibault Formal, Benjamin Piwowarski, and Stephane Clinchant Nave Labs Europe, Sorbonne Universite, CMRS
IT: In Training l OOT: Out-of-Training n Out of Domain: TREC-COVID, FiQA l タームの区分け l IDF+ (MSMARCOより対象の検索データで5倍頻度がある) l IDF-(その他) n 使用モデル l 密ベクトル: bi-encoder, TAS-B (Bi-encoderはin-batch-negativeのみを使用) l 疎ベクトル: SPLADE l Inter-Action: ColBERT l 語彙一致: BM25, doc2query-T5(クエリを生成するモデルを学習し、文書拡張する)