論文紹介：「CLICK: Contrastive Learning for Injecting Contextual Knowledge to Conversational Recommender System」

CLICK: Contrastive Learning for Injecting Contextual Knowledge to Conversational Recommender
System Inaba Lab. M2. Ryutaro Asahara

論文情報 • Hyeongjun Yang, Heesoo Won, Youbin Ahn, and Kyong-Ho
Lee. 2023. CLICK: Contrastive Learning for Injecting Contextual Knowledge to Conversational Recommender System. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics, pages 1875–1885, Dubrovnik, Croatia. Association for Computational Linguistics. 選んだ理由 • 推薦対話おいて放置されがちの問題について取り組んでいる

背景 • 推薦対話システム(CRS – Conversational Recommender System)は大きく2種類に分かれる • 共通事項→対話履歴から推薦するアイテムを予測し，応答を生成
• End to End • 全てを1つのモデルで一貫して行う • ChatGPTに推薦対話してください，というプロンプトを入力して対話するイメージ • 2 stage • 推薦をするモデルと応答をするモデルが別れている

背景 • 推薦対話システム(CRS – Conversational Recommender System)は大きく2種類に分かれる • 共通事項→対話履歴から推薦するアイテムを予測し，応答を生成
• End to End • 全てを1つのモデルで一貫して行う • ChatGPTに推薦対話してください，というプロンプトを入力して対話するイメージ • 2 stage • 推薦をするモデルと応答をするモデルが別れている今回はこっち

既存のCRSの問題点 • ユーザが言及したアイテムと推薦候補のアイテムのベクトルをマッチングして候補にランクを付けていく Item Encoder 候補アイテム1 候補アイテム2 候補アイテムn
・・・・・・ユーザが⾔及したアイテムマッチング⾔及したアイテムを⽤いるだけでは，アイテムに対するユーザの好みレベルなどが分からない⾔及しているだけで「〇〇は嫌い」と⾏っている可能性 Item Encoder

本研究のアプローチ • 対話履歴を考慮して推薦候補アイテムとマッチングしたい • しかし，異なるモダリティ間のマッチングは好ましくない • 対照学習を用いて異なるモダリティ間のマッチングを可能にする Item Encoder 候補アイテム1
候補アイテム2 候補アイテムn ・・・・・・ BERT 対話履歴マッチング

本研究のアプローチ • ２段階の学習ステップを用いる • ステップ１ • 異なるモダリティ間のマッチングを可能にするための事前学習 • 対照学習によってテキストベクトルとアイテムベクトルを近づける •
ステップ２ • テキストベクトルとアイテムベクトルを実際にマッチングする機構を作成 • 応答タイプ（質問，雑談，推薦）を決定する機構も追加

事前学習 • 文脈を考慮した嗜好性を抽出するために事前学習 • Redditデータセットを用いる[1] [1]Penha, Gustavo and Hauff, Claudia.
What Does BERT Know about Books, Movies and Music? Probing BERT for Conversational Recommendation. RecSys2020.

事前学習

事前学習– Redditデータセット • おすすめなアイテムを求める要求文と実際に推薦されたアイテムからなるデータセット • 要求文のベクトルとアイテムベクトルを近づける 𝑞：要求⽂
𝑠：要求に対する提案アイテム 𝑣：提案アイテムのスコア（いいねの数） 𝑡：提案アイテムの根拠

事前学習– DBpedia • Dbpediaを用いて映画の知識グラフを作成 • 30,471のエンティティ，392,682のトリプルで構成 • 先行研究と同様の手法を採用 • RGCNでエンコードし，アイテムベクトルを得る
[2] [2] Kun Zhou, Wayne Xin Zhao, Shuqing Bian, Yuanhang Zhou, Ji-Rong Wen, Jingsong Yu. Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion. 2020.

事前学習–対照学習 • 要求文qをBERTでエンコード • 対照学習の損失 • 正例には推薦アイテムsを用いる • スコアが大きいほどより近くなるように学習される
：ℎ! とℎ" のコサイン類似度：RGCNでエンコードしたアイテムの表現：要求⽂qに対するアイテムsのスコア

事前学習

事前学習 – 応答生成 • 応答生成器にはGPT-2を採用 • 入力 • 推薦応答を表すスペシャルトークン •
アイテム名 • 出力 • 推薦根拠t • 2層目のAttention 𝐴&を以下式で計算 • 損失は負の対数尤度：1層⽬の出⼒：要求⽂qをBERTに⼊⼒した際の出⼒ベクトル

Finetuning • 対話履歴から応答生成を行うためにFinetuning • 2つのモジュールに分かれる • Contextual Knowledge-enhanced Recommendation：推薦モジュール •
Context-enhanced Response Generation：応答モジュール

Finetuning – 推薦モジュール • 対話履歴をエンコード • 対話履歴とe番目のアイテムベクトル𝑛! から重みを計算 • 対話履歴を使って候補アイテム群に重みをつける
• アイテムベクトルに重みをかける • ユーザの嗜好性を考慮したアイテムベクトルが得られる 𝑛' ∈ 𝑁()) 𝑁())：⾔及されたアイテムの集合

Finetuning – 推薦モジュール • アイテムベクトル，対話履歴のベクトルのどちらを使うか決定するためにゲート機構を採用 • 最終的なユーザベクトル
を得る • 内積を用いて候補アイテムとマッチングスコアを計算

Finetuning – 推薦モジュール • クロスエントロピー損失

Finetuning – 応答モジュール • 対話履歴のベクトルから応答タイプ（質問，雑談，推薦）を予測

Finetuning – 応答モジュール • GPT-2を用いて応答を生成 • 入力 • 応答タイプを表すスペシャルトークン •
選ばれた推薦アイテム • 出力 • 応答 • 対話履歴の情報は事前学習と同様に，Attentionに注入

実験 – データセット • REDIAL • CRSのための映画ドメインデータセット • 1000万対話を収録 •
発話タイプはこのデータセットにラベルがあるためそれを使う • 知識グラフ • DBpedia

結果（推薦） • +Reddit • 事前にRedditデータによる推薦根拠生成タスクで学習されているもの

結果（推薦） – Ablation Study • w/o relevance • 対照学習損失からいいね数のスコアを削除 •
w/o pre-training

結果（応答生成）

結果（応答生成） - Ablation Study • w/o gen. cross-att • 対話履歴の情報をAttention層に注入しない
• つまり，対話履歴をそのままGPT-2に入力 • w/o gen. pre-training • 応答生成の事前学習のみ行わない • w/o pre-training

Case Study • Case 3においてユーザは”ジョンウィック”が見たいと言っている • しかし聞いているのは娘におすすめの映画
• CLICは対話履歴を考慮しているために娘に対する適切な推薦が可能

まとめ • 対話履歴を考慮して推薦を行うためにCLICを提案 • CLICは対照学習を用いた事前学習でエンコーダ間のモダリティの差異を緩和 • 事前学習とFinetuningを行うことで最良の性能を示した

不十分な点や弱点は？ • 事前学習時は短いテキストでの学習を行っているが，Finetuning時は対話履歴をエンコードしている • 事前学習時にも対話履歴での学習をするほうが望ましい • 対話履歴に対して嗜好性を表すアノテーションが必要

論文紹介：「CLICK: Contrastive Learning for Injecting...

論文紹介：「CLICK: Contrastive Learning for Injecting Contextual Knowledge to Conversational Recommender System」

Ryutaro Asahara

More Decks by Ryutaro Asahara

Featured

Transcript

CLICK: Contrastive Learning for Injecting Contextual Knowledge to Conversational Recommender

論文情報 • Hyeongjun Yang, Heesoo Won, Youbin Ahn, and Kyong-Ho

背景 • 推薦対話システム(CRS – Conversational Recommender System)は大きく2種類に分かれる • 共通事項→対話履歴から推薦するアイテムを予測し，応答を生成

背景 • 推薦対話システム(CRS – Conversational Recommender System)は大きく2種類に分かれる • 共通事項→対話履歴から推薦するアイテムを予測し，応答を生成

既存のCRSの問題点 • ユーザが言及したアイテムと推薦候補のアイテムのベクトルをマッチングして候補にランクを付けていく Item Encoder 候補アイテム1 候補アイテム2 候補アイテムn

本研究のアプローチ • ２段階の学習ステップを用いる • ステップ１ • 異なるモダリティ間のマッチングを可能にするための事前学習 • 対照学習によってテキストベクトルとアイテムベクトルを近づける •

事前学習 • 文脈を考慮した嗜好性を抽出するために事前学習 • Redditデータセットを用いる[1] [1]Penha, Gustavo and Hauff, Claudia.

事前学習

事前学習– Redditデータセット • おすすめなアイテムを求める要求文と実際に推薦されたアイテムからなるデータセット • 要求文のベクトルとアイテムベクトルを近づける 𝑞：要求⽂

事前学習– DBpedia • Dbpediaを用いて映画の知識グラフを作成 • 30,471のエンティティ，392,682のトリプルで構成 • 先行研究と同様の手法を採用 • RGCNでエンコードし，アイテムベクトルを得る

事前学習–対照学習 • 要求文qをBERTでエンコード • 対照学習の損失 • 正例には推薦アイテムsを用いる • スコアが大きいほどより近くなるように学習される

事前学習

事前学習 – 応答生成 • 応答生成器にはGPT-2を採用 • 入力 • 推薦応答を表すスペシャルトークン •

Finetuning • 対話履歴から応答生成を行うためにFinetuning • 2つのモジュールに分かれる • Contextual Knowledge-enhanced Recommendation：推薦モジュール •

Finetuning – 推薦モジュール • 対話履歴をエンコード • 対話履歴とe番目のアイテムベクトル𝑛! から重みを計算 • 対話履歴を使って候補アイテム群に重みをつける

Finetuning – 推薦モジュール • アイテムベクトル，対話履歴のベクトルのどちらを使うか決定するためにゲート機構を採用 • 最終的なユーザベクトル

Finetuning – 推薦モジュール • クロスエントロピー損失

Finetuning – 応答モジュール • 対話履歴のベクトルから応答タイプ（質問，雑談，推薦）を予測

Finetuning – 応答モジュール • GPT-2を用いて応答を生成 • 入力 • 応答タイプを表すスペシャルトークン •

実験 – データセット • REDIAL • CRSのための映画ドメインデータセット • 1000万対話を収録 •

結果（推薦） • +Reddit • 事前にRedditデータによる推薦根拠生成タスクで学習されているもの

結果（推薦） – Ablation Study • w/o relevance • 対照学習損失からいいね数のスコアを削除 •

結果（応答生成）

結果（応答生成） - Ablation Study • w/o gen. cross-att • 対話履歴の情報をAttention層に注入しない

Case Study • Case 3においてユーザは”ジョンウィック”が見たいと言っている • しかし聞いているのは娘におすすめの映画

まとめ • 対話履歴を考慮して推薦を行うためにCLICを提案 • CLICは対照学習を用いた事前学習でエンコーダ間のモダリティの差異を緩和 • 事前学習とFinetuningを行うことで最良の性能を示した