Upgrade to Pro — share decks privately, control downloads, hide ads and more …

15分で検索エンジニアになる

 15分で検索エンジニアになる

SGG x Zli合同LTの資料です

Natsu Ozawa

August 22, 2021
Tweet

More Decks by Natsu Ozawa

Other Decks in Programming

Transcript

  1. アナライザ(例) standard tokenizer standard filter lowercase filter stop filter standard

    analyzer “The quick brown fox.” [“The”, “quick”, “brown”, “fox”] [“the”, “quick”, “brown”, “fox”] [“quick”, “brown”, “fox”]
  2. Field-centric searchの問題点 • Albino elephant problem • 高いスコアを出すのに、全ての検索キーワードがマッチする必要はな い •

    Signal discordance problem • ユーザーのイメージと検索に使われるフィールドが異なる • ユーザーはあまりフィールドのことを考えていない
  3. Term-centric search stardust stardust crusaders crusaders タイトル (tf-idf) 説明文 (tf-idf)

    タイトル (tf-idf) 説明文 (tf-idf) function function function Score: 0.1143
  4. Cross fields stardust stardust crusaders crusaders title subtitle title subtitle

    function function function Score: 0.1143 tf-idf tf-idf
  5. Ranking関数 • Sum, max, weighted sumなど • 条件付きブースト • 条件つきフィルター

    • 独自の関数を定義 • 例:Decay function Relevant Search figure 7.11