Slide 1

Slide 1 text

知識ベース推薦システム 第4回 推薦システム概論 奥 健太

Slide 2

Slide 2 text

シナリオ Aliceは研究室のメンバーに旅行のお土産を買おうと、お土産検索サイトである土 産サーチからお土産を探しています。旅行先は北海道、予算は3,000円で、研究室 のメンバー数は20名です。チョコレートアレルギーもちのメンバーもいるので注 意が必要です。メンバーには旅行が終わってから7日後にお土産を渡す予定です。 これらの情報を土産サーチの各フォームに入力しました。さて、Aliceにはどのよ うな土産が推薦されるのでしょうか? 土産サーチのインタフェース

Slide 3

Slide 3 text

コールドスタート問題 内容ベース推薦システム、協調ベース推薦システム 日常的なコンテンツ (映画、音楽、書籍など) ➢ 評価履歴や評価値行列が蓄積されやすい 非日常的なコンテンツ (自動車、不動産、旅行、宿泊施設など) ➢ 評価履歴や評価値行列がほとんど蓄積されない ➢ 十分な評価履歴や評価値行列が蓄積されていることが前提 コールドスタート問題

Slide 4

Slide 4 text

知識ベース推薦システム (knowledge-based recommender system) ユーザ自身が要求を推薦システムに明示的に入力し、適宜要求を修正しな がら、最終的に満足のいくアイテムを見つける 制約ベース推薦システム 事例ベース推薦システム ユーザ要求を制約という形で表し、その制約を満たすアイテムをアイテムデータ ベースから検索するシステム 「このアイテムと類似したアイテムがほしい」というように、ユーザ要求を事例 となるアイテムとして提示し、その事例に類似するアイテムをアイテムデータベ ースから見つけるシステム

Slide 5

Slide 5 text

制約ベース推薦システム (constraint-based recommender system)

Slide 6

Slide 6 text

制約ベース推薦システム ユーザ要求を制約という形で表し、その制約を満たすアイテムをアイテム データベースから検索するシステム 要求の 緩和・追加 選択クエリ アイテムDB

Slide 7

Slide 7 text

ユーザ変数(user variable) 変数 vuk の定義域(domain) ユーザ変数

Slide 8

Slide 8 text

ユーザ要求(user requirement) ユーザ要求

Slide 9

Slide 9 text

アイテム変数(item variable) 商品ID 商品名 名産地 種類 価格 内容量 賞味期限 1 うにせんべい 10個入り 北海道 せんべい 4,000 10 30 2 うにせんべい 20個入り 北海道 せんべい 5,000 20 30 3 かにえびせんべい 20個入り 北海道 せんべい 2,500 20 21 4 じゃがチョコ 10個入り 北海道 チョコレート 1,000 10 21 5 じゃがチョコ 25個入り 北海道 チョコレート 2,000 25 21 6 ストロベリー大福 15個入り 北海道 大福 2,500 15 3 7 ストロベリー大福 5個入り 北海道 大福 1,000 5 3 8 とうきびクッキー 30個入り 北海道 クッキー 2,000 30 7 9 バターポテトクッキー 10個入り 北海道 クッキー 1,000 10 10 10 バターポテトクッキー 25個入り 北海道 クッキー 2,000 25 10 11 ミルクチーズクッキー 15個入り 北海道 クッキー 2,500 15 7 12 ミルクチーズクッキー 20個入り 北海道 クッキー 3,000 20 7 13 ミルクチョコレート 15個入り 北海道 チョコレート 1,500 15 30 14 ミルクチョコレート 30個入り 北海道 チョコレート 2,500 30 30 15 りんごショコラ 10個入り 北海道 チョコレート 2,000 10 21 16 りんごショコラ 20個入り 北海道 チョコレート 3,000 20 21 17 ずんだチョコ 20個入り 宮城 チョコレート 3,000 20 10 アイテムデータベース アイテム変数 変数 vik の定義域

Slide 10

Slide 10 text

アイテム制約(item constraint) 商品ID 商品名 名産地 種類 価格 内容量 賞味期限 1 うにせんべい 10個入り 北海道 せんべい 4,000 10 30 2 うにせんべい 20個入り 北海道 せんべい 5,000 20 30 : : : : : : : 17 ずんだチョコ 20個入り 宮城 チョコレート 3,000 20 10 アイテム制約の集合 アイテム制約

Slide 11

Slide 11 text

適合性制約(compatibility constraint) グループにチョコレートアレルギーもちの人がいる 場合にはチョコレートを選択できない 適合性制約 複数の条件の間で矛盾がないようにユーザ要求を適正に修正するための制約

Slide 12

Slide 12 text

フィルタ制約(filter constraint) ユーザ要求をアイテムの選択条件に変換する関係を定義した制約 フィルタ制約

Slide 13

Slide 13 text

推薦タスク(recommendation task) 推薦知識ベースを基にユーザ要求を満たす推薦アイテムを決定するタスク 有限の変数集合 各変数の定義域 有限の制約集合 推薦タスク 推薦知識ベース(recommendation knowledge base) 制約充足問題

Slide 14

Slide 14 text

ユーザ要求から選択クエリの作成 ユーザ要求 適合性制約 フィルタ制約 選択クエリ(selection query)

Slide 15

Slide 15 text

推薦 商品ID 商品名 名産地 種類 価格 内容量 賞味期限 3 かにえびせんべい 20個入り 北海道 せんべい 2,500 20 21 8 とうきびクッキー 30個入り 北海道 クッキー 2,000 30 7 10 バターポテトクッキー 25個入り 北海道 クッキー 2,000 25 10 12 ミルクチーズクッキー 20個入り 北海道 クッキー 3,000 20 7 選択クエリ

Slide 16

Slide 16 text

要求の緩和(relaxation) 修正案(repair alternatives)

Slide 17

Slide 17 text

要求の追加 デフォルト値(default value) 静的デフォルト(static default) 平均や相場など、多くの人が指定するであろう という知識に基づく値 従属デフォルト(dependent default) 他の属性に指定された値に応じて設定される値 導出デフォルト(derived default) 他のユーザのユーザ要求履歴に基づく値

Slide 18

Slide 18 text

事例ベース推薦システム (case-based recommender system)

Slide 19

Slide 19 text

事例ベース推薦システム 「このアイテムと類似したアイテムがほしい」というように、ユーザ要求 を事例となるアイテムとして提示し、その事例に類似するアイテムをアイ テムデータベースから見つけるシステム 選択 アイテムDB 類似検索 批評

Slide 20

Slide 20 text

初期事例 最初にユーザからシステムに事例(case)となるアイテムを提示

Slide 21

Slide 21 text

アイテムの特徴ベクトル アイテム i の特徴ベクトル ずんだちょこ20個入り(i = 17)の特徴ベクトル 商品ID 商品名 名産地 種類 価格 内容量 賞味期限 17 ずんだチョコ 20個入り 宮城 チョコレート 3,000 20 10 類似度算出には 関係しない 名産地の類似性には こだわっていない コサイン類似度 は適用できない

Slide 22

Slide 22 text

類似性尺度(similarity metrics) 属性 k に関する類似度関数 属性 k の重み アイテム xi と xj の類似度を算出する類似度関数 二つのアイテムがどの程度類似しているかを表す尺度

Slide 23

Slide 23 text

内容量に関する類似度関数 事例アイテムの特徴量

Slide 24

Slide 24 text

価格に関する類似度関数 事例アイテムの特徴量 安ければ安い方が良い 属性 k に関するパラメタ

Slide 25

Slide 25 text

αk と類似度の関係 安ければ安い方が良い 3,000円以下であれば どれも同等 3,000円が適正価格であり、それ よりも安すぎても高すぎても困る 高いよりかは安い方が良いが、 3,000円が適正価格である

Slide 26

Slide 26 text

各属性に関する類似度関数 価格 内容量 賞味期限 安ければ安い方が良い 少ないより多い方が良いが適量がベスト 長ければ長い方が良い 種類 カテゴリが一致していれば類似

Slide 27

Slide 27 text

アイテム間の類似度 商品ID 商品名 名産地 種類 価格 内容量 賞味期限 17 ずんだチョコ 20個入り 宮城 チョコレート 3,000 20 10 商品ID 商品名 名産地 種類 価格 内容量 賞味期限 5 じゃがチョコ 25個入り 北海道 チョコレート 2,000 25 21 1 1.125 0.960 1.081 アイテム xi と xj の類似度を算出する類似度関数

Slide 28

Slide 28 text

類似アイテムの推薦

Slide 29

Slide 29 text

単一批評(unit critique) 提示されたアイテム属性のうち一つの属性について要求を変更 指向的批評 提示された特徴量を基準に相対的な要求を提示 ➢ 「より多く」「より少なく」 ➢ 価格や内容量、賞味期限などの数値型属性に適している 置換的批評 提示された特徴量を別の特徴量に置き換えることで要求を提示 ➢ 「チョコレートをせんべいに変えたい」 ➢ 名産地や種類などのカテゴリ型属性に適している

Slide 30

Slide 30 text

指向的批評(directional critique)

Slide 31

Slide 31 text

置換的批評(replacement critique)

Slide 32

Slide 32 text

複合批評(compound critique) 1回のサイクルで複数の属性を変更 ➢ 「安くて日持ちする」「安くて多い」

Slide 33

Slide 33 text

動的批評(dynamic critique) データベースに含まれるアイテムの分布に応じて動的に選択肢を用意 頻出の批評パターン(critique pattern) 候補アイテム数

Slide 34

Slide 34 text

各手法の長所と短所

Slide 35

Slide 35 text

知識ベース 推薦システム 内容・協調ベース 推薦システム コールドスタート 個人化 制御性 特徴量の抽出 知識獲得 知識ベース vs. 内容・協調ベース推薦システム