柳田雄輝, 加藤誠, 河田友香, 山本岳洋, 大島裕明, 藤田澄男. 検索行動に基づく購買満足度の関係分析. 第14回データ工学と情報マネジメントに関するフォーラム(DEIM 2022). オンライン, Feb. 2022.
学生プレゼンテーション賞 受賞
検索⾏動に基づく購買満⾜度の関係分析セッション番号: E23-3柳⽥雄輝 (筑波⼤学),加藤誠 (筑波⼤学 / JSTさきがけ)河⽥友⾹,⼭本岳洋,⼤島裕明 (兵庫県⽴⼤学)藤⽥澄男 (ヤフー株式会社)2022-02-28第14回データ⼯学と情報マネジメントに関するフォーラム(DEIM2022)
View Slide
ECサイトにおいて,ユーザの購買満⾜度は重要• 購買満⾜度はECサイトの利⽤継続に影響する [1]• 41%のユーザは週1回以上オンラインショッピングをしており,そのユーザを満⾜させることには⼤きな効果が期待される [2][1] Gustafsson et al. The effects of customer satisfaction, relationship commitment dimensions, and triggers on customer retention.Journal of marketing, 69(4), 2005.[2] PwC. December 2021 global consumer insights pulse survey. https://www.pwc.com/gx/en/industries/consumer-markets/consumer-insights-survey.html, (accessed 2021-12-21).背景 2
関連研究: 購買満⾜度 3• 商品に対する関⼼の⾼さと購買満⾜度の関係 [3]• サービスに対する親近感と購買満⾜度の関係 [4]• ユーザの関⼼や親近感は購買満⾜度に影響するが,それらを購⼊者の情報探索⾏動と結びつけた研究は少ない[3] Richins et al. Post-purchase product satisfaction: Incorporating the effects of involvement and time. Journal of BusinessResearch, 23(2), 1991.[4] Söderlund. Customer familiarity and its effects on satisfaction and behavioral intentions. Psychology & Marketing, 19(10), 2002.関⼼の⾼さ満⾜度親近感の⾼さ満⾜度の分散正の相関正の相関
• ECサイトにおける検索セッションの意図と検索満⾜度の関係 [5]‒ 直接購買に関する検索は2つの意図に分類できることも⽰した• 検索意図と「検索結果の」満⾜度は分析されているが,「購買」満⾜度との関係は分析されていない[5] Su et al. User intent, behaviour, and perceived satisfaction in product search. WSDM 2018.関連研究: 購買に関する検索⾏動 4クエリカメラ おすすめカメラ 初⼼者⽤クエリEOS スペックEOS R5 価格EOS R5 中古ECサイトの検索セッション各セッションへ意図の割当意図意図に沿った検索結果を表⽰検索結果の満⾜度満⾜例クエリカメラ おすすめカメラ 初⼼者⽤クエリEOS スペックEOS R5 価格EOS R5 中古検討中探索中不満⾜購⼊を検討していることを⽰す意図商品を探索していることを⽰す意図
商品購買前後の情報探索⾏動と購買満⾜度の関係を分析• 本研究の知⾒によってできるようになること‒ 検索⾏動によるレビューをしていないユーザの購買満⾜度予測‒ 満⾜度を⾼めるような検索⽀援研究⽬的 5ECサイトでの商品購買前後のWeb検索⾏動とレビュー評価の関係を明らかにする⊃≡定義部分集合対象データ 扱う満⾜度探索⾏動を考慮するか?購買満⾜度の既存研究 ユーザ・商品特性 「購買」満⾜度 ❌検索⾏動の既存研究 ログ,被験者実験 「検索」満⾜度 ⭕本研究 ログ,ユーザ・商品特性 「購買」満⾜度 ⭕既存研究との⽐較本研究でも取り組む
• RQ1: 購買に満⾜したユーザと不満⾜なユーザの検索⾏動の違いは?A 満⾜したユーザは,購買直後も商品に関する検索の割合が⾼い• RQ2: RQ1において,商品特性が異なる場合は?A 商品特性の中でも,価格帯が異なる場合:満⾜したユーザは,⾼価な商品を買う場合は⻑期的に調べる傾向• RQ3: RQ1において,ユーザ特性が異なる場合は?A ユーザ特性の中でも,購買経験が異なる場合:不満⾜なユーザは,購買経験が複数回ある場合は購買直前に集中して調べる傾向Research Questionとその回答 6
• Yahoo! 検索: ⽇常的に(≡毎⽉10⽇以上)利⽤するユーザの検索ログ• Yahoo! ショッピング: 購買ログ・レビューログ‒ 5段階評価のうち,レートが3以下のレビューでは不満が⾒られたため4以上のレートが付いたレビューを満⾜とする• ⾼価な商品であれば,商品に関する情報を探索するクエリが現れやすいと考えられる‒ そのため,本研究ではカメラカテゴリを対象とするデータセット 7
商品の絞り込み度合いを捉えるためクエリに意図を割り当てる分析の流れ 8クエリEOS R5 価格カメラ おすすめ運動会 撮影つくば 天気クエリログクエリ 検索意図EOS R5 価格 検討中カメラ おすすめ 探索中運動会 撮影 その他つくば 天気 その他クエリ 検索意図EOS R5 価格 検討中カメラ おすすめ 探索中運動会 撮影 探索中つくば 天気 その他ルールベースによる意図の割当弱教師あり学習による意図の割当クエリを分類する=各意図を時区間ごとに集計,正規化時間割合ログは多量 → 先⾏研究の意図をもとに⾃動で分類
クエリに商品の絞り込み度合いを表す意図を割り当てたい→価格.comより商品辞書を作成,ルールベースでクエリを分類• 検討中: 購⼊を検討している段階‒ 先⾏研究の Target finding に相当‒ クエリ内にカメラのメーカー名,型番,商品名のいずれかを含む• 探索中: 商品を探索している段階‒ 先⾏研究の Decision making に相当‒ 検討中の条件を満たさず,クエリ内に”カメラ”を含む• その他意図の割り当て (ルールベースによる分類) 9クエリEOS R5 価格カメラ おすすめ運動会 撮影つくば 天気クエリ 検索意図EOS R5 価格 検討中カメラ おすすめ 探索中運動会 撮影 その他つくば 天気 その他カメラに関係するがその他と分類分類[5] Su et al. User intent, behaviour, and perceived satisfaction in product search. WSDM 2018.先⾏研究 [5]をもとに作成意図(絞り込み度合い)ごとに検索⾏動の違いを分析
ルールベースでは捉えきれない傾向を弱教師あり学習で捉える• カメラに関係するクエリを捉えたい• その他に分類されたクエリの中からカメラに関係する語を抽出‒ 語が商品辞書に含まれていないことから探索中と分類意図の割り当て (弱教師あり学習による分類) 10クエリ 検索意図EOS R5 価格 検討中カメラ おすすめ 探索中運動会 撮影 その他つくば 天気 その他クエリ 検索意図EOS R5 価格 検討中カメラ おすすめ 探索中運動会 撮影 探索中つくば 天気 その他分類カメラに関係するがその他と分類された語
疑似正例: 型番,製品名,”カメラ”に挟まれているクエリ‒ ⾃⼰相互情報量や出現頻度が低い語を除く弱教師あり学習の設定 11検索セッション カメラに関係なさそうなセッションつくば 観光筑波⼭ 歴史カメラ 初⼼者⽤レンズ 選び⽅EOS R5 スペックルールベースで得られた意図探索中その他検討中その他その他検索の時系列カメラに関係しそう疑似負例: 検討中,探索中が⼀度も出現しないセッションのクエリ11⋮0⼊⼒: クエリのBag of Words運動会観光撮影⁝予測正例• 予測にはロジスティック回帰を使⽤• 予測ラベルが適切か判定した結果,F1値0.80で分類成功‒ 他モデルでも結果は変わらず出⼒: カメラ関係語かどうか
各意図の出現回数を時区間ごとにカウント多く検索しているユーザの影響を減らすためユーザごとに正規化意図の集計,正規化 12時区間 ユーザ1 ユーザ2 ユーザ3⁝購買1週間前 6 5 8⁝購買2週間後 2 1 7⁝合計 15 9 20ある意図における時区間ごとの検索回数時区間 ユーザ1 ユーザ2 ユーザ3⁝購買1週間前 6/15 5/9 8/20⁝購買2週間後 2/15 1/9 7/20⁝合計 15 9 20正規化時区間ごとの正規化された検索回数平均平均0.450.20
検討中の意図における出現割合の時間変化RQ1: 購買に満⾜したユーザとそうでないユーザの検索⾏動の違いは? 1300.010.020.030.040.050.060.070.080.09(-4w,-3w](-3w,-2w](-2w,-1w](-1w,0][0,+1w)[+1w,+2w)[+2w,+3w)[+3w,+4w)割合時区間満⾜不満⾜購買直後から1 week (w)後以内購買に満⾜したユーザは検討中の割合が⾼い推測探索中の意図でも同様の結果満⾜したユーザは購買直後も商品について調べる傾向満⾜したユーザは使い⽅や説明書を検索していた
• 商品特性の中でも価格に注⽬し,その中央値で⼆分RQ2: 商品の特性が異なる場合の検索⾏動の違いは? 14-0.02-0.0100.010.020.030.040.050.060.070.080.090.10.11割合満⾜不満⾜00.010.020.030.040.050.060.070.080.090.10.11割合(-3w, -2w](-2w, -1w](-1w, 0][0, +1w)[+1w, +2w)[+2w, +3w)[+3w, +4w)(-4w, -3w]検討中,価格が中央値以上探索中,価格が中央値以上満⾜したユーザは購買直前直後以外も検索価格が中央値以下の場合はRQ1と似た傾向推測満⾜したユーザはより広く商品を探す傾向満⾜度で語彙の違いは⾒られず,おすすめや価格.comを検索していた
• ユーザ特性の中でも購買経験に注⽬,複数回購買しているかどうかで⼆分RQ3: ユーザの特性が異なる場合の検索⾏動の違いは? 1500.010.020.030.040.050.060.070.080.090.10.11割合満⾜不満⾜00.010.020.030.040.050.060.070.080.090.10.11割合(-3w, -2w](-2w, -1w](-1w, 0][0, +1w)[+1w, +2w)[+2w, +3w)[+3w, +4w)(-4w, -3w]検討中複数回購買探索中複数回購買購買が1回の場合はRQ1と似た傾向推測満⾜したユーザは徐々に割合を増加させている→購買に慣れたユーザの場合,継続的な検索が満⾜に結びつく不満⾜なユーザは購買直前に集中して検索
• 各意図の時区間ごとの割合から満⾜度(満⾜ or 不満⾜)を予測‒ 特徴の重みを⽰すため,ランダムフォレストとロジスティック回帰で学習‒ 正解率は0.50以下• データの8割以上が満⾜クラスに属するため,アンダーサンプリングを⾏った結果,データ数が⾜りていないと考えられるクエリの意図の割合による満⾜度予測 16時区間 ユーザ1 ユーザ2 ユーザ3⁝購買1週間前 6/15 5/9 8/20⁝購買2週間後 2/15 1/9 7/20⁝合計 15 9 20時区間ごとの正規化された検索回数列ベクトルを標準化0.31.1⋮−0.80.4−0.1⋮1.20.2−0.5⋮−0.6予測満⾜ 満⾜ 不満⾜出⼒: 満⾜/不満⾜⼊⼒
• 各ユーザの購買前のクエリ集合から満⾜度を予測‒ 10⼈以上が検索している語に限定‒ ロジスティック回帰で予測した結果,正解率0.53• ランダムフォレストの正解率: 0.45クエリ語による満⾜度予測 17-0.500.51ECサイトA胃がんむき⽅ECサイトB攻略プロフィール上映館 X郵便局マイページ重み重みの上位・下位5単語25⋮1⼊⼒: クエリのBag of Words運動会観光撮影⁝予測満⾜出⼒: 満⾜/不満⾜X: センシティブワード他ECサイトの重みが⼤きい推測他のECサイトでも検索した後,Yahoo!ショッピングで購⼊している?満⾜したユーザは購買1週間前に「価格」や「⽐較」について検索していた
まとめ 18• RQ1: 購買に満⾜したユーザと不満⾜なユーザの検索⾏動の違いは?A 満⾜したユーザは,購買直後も商品に関する検索の割合が⾼い• RQ2: RQ1において,商品特性が異なる場合は?A 商品特性の中でも,価格帯が異なる場合:満⾜したユーザは,⾼価な商品を買う場合は⻑期的に調べる傾向• RQ3: RQ1において,ユーザ特性が異なる場合は?A ユーザ特性の中でも,購買経験が異なる場合:不満⾜なユーザは,購買経験が複数回ある場合は購買直前に集中して調べる傾向
補⾜資料
• Yahoo! 検索のWeb検索ログ‒ ⽇常的にWeb検索するユーザを対象とするため,毎⽉10⽇以上検索しているユーザに限定• Yahoo! ショッピングの購買ログ・100⽂字以上のレビューログ‒ 100⽂字以上のレビューでは商品について述べていた傾向‒ 5段階評価のうち,レートが3以下のレビューでは不満が⾒られたため4以上のレートが付いたレビューを満⾜とする• ⾼価な商品であれば,商品に関する情報を探索するクエリが現れやすいと考えられる‒ そのため,本研究ではカメラカテゴリを対象とするデータセットの詳細 20
意図の割合による予測の重み 21-2-1.5-1-0.500.511.5(,-4w](-4w,-3w](-3w,-2w](-2w,-1w](-1w,0][0, +1w)[+1w, +2w)[+2w, +3w)[+3w, +4w)[+4w,)重み各意図における時区間検討中探索中その他
検討中の意図における出現割合の時間変化RQ1: 購買に満⾜したユーザとそうでないユーザの検索⾏動の違いは? 22-0.0100.010.020.030.040.050.060.070.080.09(-4w,-3w](-3w,-2w](-2w,-1w](-1w,0][0,+1w)[+1w,+2w)[+2w,+3w)[+3w,+4w)割合時区間満⾜不満⾜満⾜ - 不満⾜購買直後から1 week (w)後以内購買に満⾜したユーザは検討中の割合が⾼い推測探索中の意図でも同様の結果満⾜したユーザは購買直後も商品について調べる傾向満⾜したユーザは使い⽅や説明書を検索していた
• 商品特性の中でも価格に注⽬し,その中央値で⼆分RQ2: 商品の特性が異なる場合の検索⾏動の違いは? 23-0.02-0.0100.010.020.030.040.050.060.070.080.090.10.11割合満⾜不満⾜満⾜ - 不満⾜-0.02-0.0100.010.020.030.040.050.060.070.080.090.10.11割合(-3w, -2w](-2w, -1w](-1w, 0][0, +1w)[+1w, +2w)[+2w, +3w)[+3w, +4w)(-4w, -3w]検討中,価格が中央値以上探索中,価格が中央値以上満⾜したユーザは購買直前直後以外も検索価格が中央値以下の場合はRQ1と似た傾向推測満⾜したユーザはより広く商品を探す傾向満⾜度で語彙の違いは⾒られず,おすすめや価格.comを検索していた
• ユーザ特性の中でも購買経験に注⽬,複数回購買しているかどうかで⼆分RQ3: ユーザの特性が異なる場合の検索⾏動の違いは? 24-0.03-0.02-0.0100.010.020.030.040.050.060.070.080.090.10.11割合満⾜不満⾜満⾜ - 不満⾜00.010.020.030.040.050.060.070.080.090.10.11割合(-3w, -2w](-2w, -1w](-1w, 0][0, +1w)[+1w, +2w)[+2w, +3w)[+3w, +4w)(-4w, -3w]検討中複数回購買探索中複数回購買購買が1回の場合はRQ1と似た傾向推測満⾜したユーザは徐々に割合を増加させている→購買に慣れたユーザの場合,継続的な検索が満⾜に結びつく不満⾜なユーザは購買直前に集中して検索