Upgrade to Pro — share decks privately, control downloads, hide ads and more …

そうだ、ゲームキャラに攻略情報を聞こう。~外部知識を参照した応答の実装ノウハウ~

Sakusakumura
November 26, 2023

 そうだ、ゲームキャラに攻略情報を聞こう。~外部知識を参照した応答の実装ノウハウ~

複数のLLMを用いて外部知識を参照した対話応答を実現する実装の解説。

知見:
・ベクトル検索における埋め込みモデルの重要性
・キーワード検索において精度を上げることの難しさ
・「考える側」と「応答する側」の分離、応用に関する今後の展望
・BM25を使用したキーワード検索は精度的に厳しい
・ベクトル検索のみを採用した場合でもアンサンブル的手法やRerankingを組み込むべき

プロンプトの「効きやすい / 効きにくい」 これってモデルの性能にも言えますか?
Which BM25 Do You Mean? A Large-Scale Reproducibility Study of Scoring Variants
Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents

Sakusakumura

November 26, 2023
Tweet

More Decks by Sakusakumura

Other Decks in Technology

Transcript

  1. 10 処理に応じた使い分け Embedding生成 # スペシャルウィーク 「みんなにスペシャルな... スペシャルウィーク(ウマ娘)とは、 実在の競走馬、スペシャルウィー… ##アニメでの活躍 北海道からはるばるトレセン学園

    に編入してきた。東京に出て最初 に見たレースで、サイレンススズ… 応答生成 ##アニメでの活躍 北海道からはるばるトレセン学園 に編入してきた。東京に出て最初 に見たレースで、サイレンススズ カの姿に感動し、大きなあこがれ を持つようになる。そして、同じ 時に出会ったトレーナーにその才 能を見染められ、チーム「スピ カ」に拉致同然で連れて来られて 加入することになる。
  2. キーワード検索の難しさ • 今回のシステムで実装予定だった • 検索精度が低く、ノイズになったため除外 • ベクトル検索のみ • ハイブリッド検索をするにはRerankerが必要 •

    (GPT-4はRerankingに高い精度を発揮する[1]) • 使用予定だったアルゴリズム: BM25 • 普遍的なワードに邪魔される [1] Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents 13
  3. 28 参考 • プロンプトの「効きやすい / 効きにくい」 これってモデル の性能にも言えますか? • Which

    BM25 Do You Mean? A Large-Scale Reproducibility Study of Scoring Variants • Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents