On Application of Learning to Rank
for E-Commerce Search
[S. Santu+, SIGIR 2017]
Slide 7
Slide 7 text
この論文でやったこと
EC検索へランキング学習を適用・モデルや特徴量、ラベルについて考察
Q. どんなモデル(最適化手法)が強かった?
A. LambdaMART(勾配ブースティング木を使ったランキングモデル)が
圧倒的に高い精度
Q. どんな特徴量が効いた?
A. 商品の人気度を表す特徴量(売り上げ・レビュー数・レイティング)が効いた
Q. どんなラベルで学習するのが良い?
A. クリック・購入・売り上げ・カート追加を試したが
購入をラベルにすると安定した精度が得られた.
クラウドソーシングによるラベリングは上手くいかなかった
Slide 8
Slide 8 text
ランキング学習 Learning to Rank
文書間の順序関係を訓練データとし、ランキング関数を構築する機械学習手法
・web検索→webページ
・EC検索→商品
・グルメサイト→お店
文書Aが文書Bよりも「良い」とき
クエリ:q1
Perfect
Bad
Good
クエリ:qN
Bad
Good
Excellent
…
予測対象文書
1.2 0.9 0.3
実験2 tailクエリの性能・表示商品の分布
← head tail → ← head tail →
学習が難しいtailクエリでも良い性能! top5件にランキングされた商品の
impression rank vs frequency
→ GEPSは万遍なく商品を表示
tailクエリで良性能は非常に嬉しい