Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[IR Reading 2022秋 論文紹介] Price DOES Matter!: Modeling Price and Interest Preferences in Session-based Recommendation (SIGIR 2022) /IR-Reading-2022-fall

Kohei Shinden
November 12, 2022

[IR Reading 2022秋 論文紹介] Price DOES Matter!: Modeling Price and Interest Preferences in Session-based Recommendation (SIGIR 2022) /IR-Reading-2022-fall

Published on Nov 12, 2022
IR Reading 2022秋(オンライン) 開催案内 - ACM SIGIR 東京支部: https://sigir.jp/post/2022-11-12-irreading_2022fall/

論文:
Zhang et al., Price DOES Matter!: Modeling Price and Interest Preferences in Session-based Recommendation, SIGIR 2022, https://dl.acm.org/doi/10.1145/3477495.3532043, (arXiv: https://arxiv.org/abs/2205.04181)

Kohei Shinden

November 12, 2022
Tweet

More Decks by Kohei Shinden

Other Decks in Research

Transcript

  1. [論⽂紹介] Price DOES Matter!: Modeling Price and Interest Preferences in

    Session-based Recommendation Xiaokun Zhang, Bo Xu, Liang Yang, Chenliang Li, Fenglong Ma, Haifeng Liu, Hongfei Lin SIGIR 2022 論⽂紹介する⼈ 筑波⼤学加藤研究室 新⽥洸平 https://sites.google.com/view/kohei-shinden ※スライド中の図は論⽂より引⽤ 2022年11⽉12⽇ IR Reading 2022 秋 ⼀般セッション1 No.1
  2. どんな論⽂? 2 • セッションベース推薦においてユーザのアイテムに対する 価格と興味の嗜好を考慮するモデルの提案を⾏う論⽂ 時間 セッション1 セッション2 セッション3 \3,000

    \2,980 \8,900 \7,500 \7,900 \5,600 \5,300 価格 カテゴリ (興味) ファッション ファッション ファッション ファッション ファッション 書籍 書籍 アイテム • アイテムの購買における興味と価格の関係性を異種ハイパーグラフで表現 • 集約機構による特徴量⽣成とAttentionによる嗜好抽出 • 興味と価格の嗜好特徴を共同で学習することで相互の関係性を表現 セッションベース推薦におけるアイテムの価格とカテゴリのイメージ
  3. セッションベース推薦の既存研究では アイテムに対する価格嗜好を考慮していない 価格をモデル化する際の課題 • 価格嗜好はアイテムの興味嗜好によって変化しやすい ‒ アイテムに関する複数の情報と価格とをうまく捉える必要がある • 価格弾⼒性:商品の購買における価格と興味のトレードオフ ‒

    アイテムの価格に応じて購買するか否かの興味が変わりやすい • e.g., 欲しかった商品が⾼くなったので買うのをやめよう/安くなったから買おう • e.g., ⾼いけどプレミアで今しか⼿に⼊らないしどうしても欲しいから買おう 背景と課題 3
  4. • Co-guided Heterogeneous Hypergraph Network(CoHHN): 価格・興味嗜好の相互の影響を捉えるような推薦モデル ‒ 価格や興味の関係を捉える異種ハイパーグラフ,グラフ特徴集約機構, Attention による価格と興味の嗜好抽出,価格と興味の

    Co-guided Learning • ハイパーグラフ: エッジが任意の数の頂点を持つようなグラフ 提案⼿法 4 ⼊⼒:セッションデータ 特徴量: ID, 価格, カテゴリ 同⼀タイプチャネルにおける ノードの重要度を埋め込む マルチヘッド Self-Attentionで 価格嗜好とセッションの 興味嗜好をモデル化 価格嗜好と興味嗜好の 相互の関係性をモデル化
  5. リサーチクエスチョン 5 RQ 内容 結果 RQ1 提案モデルは SOTA を達成しているか? 提案⼿法が全てのデータセットに

    対する全ての指標で SOTA RQ2 セッションベース推薦における価格の影響は? 価格と興味の嗜好を 両⽅考慮することが重要 RQ3 Co-guided Learning はどんな効果を持つか? 価格と興味の関係は複雑であり Co-guided Learning は効果的 RQ4 異なる価格帯におけるパフォーマンスの違いは あるか? ユーザの価格と興味の嗜好に 応じたパーソナライズが可能 RQ5 主要なハイパーパラメータはどのような影響を 与えるか? 価格レベル数とデュアルチャネル集計 反復回数はそれぞれドメインで異なる
  6. • データセット ‒ Cosmetics: 化粧品オンラインショップのデータセット ‒ Diginetica-buy: Eコマースデータセット ‒ Amazon:

    Amazonの購買⾏動 • 評価指標 ‒ Precision@k: 推薦リスト中に True Item が含まれる割合 ‒ MRR@k: 推薦リスト中のランク k 番⽬の True Itemまでの適合率の平均 • k = 10, 20 • ベースライン ‒ いずれもセッションベース推薦⼿法でありGNNベース⼿法か, Attention機構を持つかなどの違いがある • S-POP, SKNN, GRU4Rec, NARM, BERT4Rec, SR-GNN, LESSR, S2-DHCN, COTREC 実験設定 6 データセットの統計情報 Amazonはアイテム数が少ない
  7. RQ1: 性能について 7 • 提案⼿法が全てのデータセットに対する全ての指標で SOTA ‒ NARM, BERT4Rec は

    GRU4Rec を⼤きく上回る →セッションにおける意図を捉えるのに Attention が重要である可能性 ‒ CoHNN には劣っており,GNN ベース⼿法であってもアイテムの特徴に隠れた価格や興 味の嗜好をモデル化することが難しいことがわかる ‒ 異種グラフと Co-guided Learning を含む提案⼿法である CoHNN によって価格と興味の 影響を両⽅考慮することで性能向上することがわかった *: t 検定による統計的有意性 (𝑝 < 0.01)
  8. RQ2: 価格の影響について 8 • 価格嗜好と興味嗜好の相互影響を考慮することで性能向上 ‒ CoHHN-p: 価格嗜好を考慮しない(興味嗜好は考慮) ‒ CoHHN-c:

    興味嗜好を考慮しない(価格嗜好は考慮) ‒ CoHHN-pp: 価格のみ考慮(ユーザの価格嗜好は考慮しない) *: t 検定による統計的有意性 (𝑝 < 0.01) • 価格と興味の嗜好をそれぞれ考慮 することで相互の影響を捉えられ ている • 価格の異なる離散化による⽐較実験に おいて最も良い性能 →ユーザの価格設定をうまく捉えている
  9. • 価格と興味の関係は複雑であり Co-guided Learning は効果的 RQ3: Co-guided Learning の効果 9

    *: t 検定による統計的有意性 (𝑝 < 0.01) • CoHHN-co は Co-guided Learning をせずに 価格と興味の特徴量を単純に加算している →Co-guided Learning は価格と興味の嗜好を捉 えるのに効果的であることがわかる この部分
  10. • CoHNN はユーザの価格嗜好に応じたパーソナライズが可能 ‒ 興味はユーザごとに異なるが価格については低価格に偏りやすい →そのため,低価格の商品ばかりを推薦すれば精度向上するかもしれない ‒ ⼀⽅で,推薦サービスにとって利益は重要であり⾼価格のアイテムを取り⼊れた状態の 精度が重要であり,価格嗜好の識別は重要 RQ4:

    異なる価格帯におけるパフォーマンス 10 異なる価格帯ごとの各⼿法の精度 • 図中のオレンジの線が提案⼿法であり全ての価格帯で性能向上 →ユーザの価格嗜好をうまく捉えていることがわかる →サービスの収益増に貢献できると主張 他のデータセットでも同様の結果 両⽅の図において 3 が ⾼いのは多くのユーザ が中低価格のアイテム を購⼊しやすいため
  11. • 価格レベル数とデュアルチャネル集計反復回数はそれぞれ データのドメインによってで異なる RQ5: ハイパーパラメータの検討 11 • 価格を離散化する際の価格レベ ルの設定数はそれぞれのデータ セットによって⼤きく異なる

    • 反復回数が⼤きすぎるとノード間の情報融 合の度合いが⼤きくなり過度に平滑化する 可能性 • ノード数が少ない場合,モデルがより少な い反復回数で正確なノード埋め込みを学習 できる可能性