複数のLLMを用いて外部知識を参照した対話応答を実現する実装の解説。
知見:
・ベクトル検索における埋め込みモデルの重要性
・キーワード検索において精度を上げることの難しさ
・「考える側」と「応答する側」の分離、応用に関する今後の展望
・BM25を使用したキーワード検索は精度的に厳しい
・ベクトル検索のみを採用した場合でもアンサンブル的手法やRerankingを組み込むべき
・プロンプトの「効きやすい / 効きにくい」 これってモデルの性能にも言えますか?
・Which BM25 Do You Mean? A Large-Scale Reproducibility Study of Scoring Variants
・Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents