Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マーケット・バスケット分析を活用したECサイトの購買分析

 マーケット・バスケット分析を活用したECサイトの購買分析

2021/8/20(金)に開催したExploratory データサイエンス勉強会#20の株式会社エートゥジェイ様のご登壇資料です。

26a31e16aab1fc9c4522dfa3a2c8ce6c?s=128

Ikuya Murasato

August 20, 2021
Tweet

Transcript

  1. Copyright © Atoj. All Rights Reserved CONFIDENTIAL マーケット・バスケット分析を活用したECサイトの購買分析
 2021.08.20
 株式会社AtoJ

    佐藤 史渉
  2. 2 会社概要
 会社名
 株式会社エートゥジェイ / AtoJ,Inc. 
 設立
 2007年3月9日
 所在地


    東京都港区南青山2-2-8 南青山DFビル 8階 
 TEL 03-5772-2581 
 FAX 03-5772-2582 
 資本金
 132,375,000円
 従業員数
 62名(業務委託、外部協力会社含まず) 
         代表者 
 代表取締役社長 飯澤 満育(マイク) 

  3. 3 会社概要


  4. 4 会社概要


  5. 5 自己紹介
 名前:佐藤 史渉(さとう ふみあき) 所属:Webソリューション第1局(2018年2月入社) 業務内容:Webサイトの制作ディレクション、 ECサイトの分析・運用・施策提案 ▪Exploratryとの出会い GoogleAnalytics以外でサイト分析に使えるツールはないか探していたところ、株式会社プリンシプル のセミナーを聴講したのをきっかけに Exploratoryの存在を知り、時系列予測の機能など様々な分析・解析

    技術や技法を簡単に試すことができる事 に惹かれ上長にかけあい導入させていただきました。
  6. 6 AGENDA
 1. 今回の発表の背景 2. ヒートマップを使って一緒に買われる商品の可視化 3. マーケット・バスケット分析 4. 得られたインサイトと施策

    5. 今後の取り組み
  7. 今回の発表の背景

  8. 約300,000件(3年分) のデータ 8 今回の発表の背景 -取引先からの依頼-
 当社のECサイトの3年分の売上データから、 よく併売されている商品のリスト を作成してほしい。 できれば3年まとめたものと1年毎のデータに分けてほしい。 某企業 2021年6月 このような依頼を取引先企業からいただきました。

    佐藤 2019 2020 2021
  9. 9 今回の発表の背景 -過去のトラウマ-
 購入日 ユーザーID 購入商品 数量 2018/01/10 〇〇〇〇〇〇 デスク 1

    2018/01/10 〇〇〇〇〇〇 チェア 1 2018/05/12 △△△△△△ ベッド 1 2018/07/01 XXXXXXXXX 枕カバー 2 2018/07/05 △△△△△△ テーブル 1 ユーザーID 購入商品 1回目 数量 購入商品 2回目 数量 〇〇〇〇〇〇 デスク 、チェア 2 △△△△△△ ベッド 1 テーブル 1 XXXXXXXXX 枕カバー 2 エクセルで約200,000件のデータを関数やマクロを駆使して、 ①の元データを②のような形に成型する必要がありました。 ※実際は会員種別や購入場所 (店舗、EC)など細かく分かれており複雑でした。 ① ② まだExploratoryの存在をしらなかった 2019年。今回とは別のとある家具系 ECサイトの提案書作成の過 程で、バスケット分析を行う必要があったのですが。。。。
  10. 10 今回の発表の背景 -エクセルの限界-
 そもそも200,000件はエクセルで処理できるデータ量ではなく 、 セルに仕込んだSUMIF関数やVLOOKUP関数などで画面が固まること多数。 結局年毎にデータを分割し、多くのメモリを消費する関数は随時コピー →値を貼りつけで削除 …etc 最終的に年毎のデータを統合する事で何とかデータ加工終了。 (データ加工だけで作業時間約10時間以上。

    その内数時間はエクセルが落ちる、処理が固まるなどによるトラブル ) 今回はユーザーは関係なく、商品だけの単純なバ スケット分析ではあるけど、大量のデータの処理は もうやりたくない。断ろうか・・・
  11. 11 今回の発表の背景 -それExploratoryで解決できるかも-
 データの 取り込み Exploratory への連携 可視化 Exploratory かゆいところまで手が届く Exploratoryにデータを渡せば、

    うまいこと解決できるのでは? GoogleDrive Excel 取り込み先としては色々なツールがありますが、 GoogleDriveが最も一般的に利用されている事と Google Driveにファイルを保存することで、 Exploratory側からインサイトをスケジュールすることができるため、 クライアントの協力が得やすいかと存じます。
  12. 12 データの取り込み先を指定
 データフレーム→ファイルデータを選択し、右端の Googleドライブ→エクセルファイルを選択

  13. 13 指定のテーブルからデータを取り込み
 アカウントへの権限の付与終了後、該当アカウントに格納されている売上データを取り込む あらかじめ GoogleDriveに格 納した売上データ インポート&マージを選 択すると選択したファ イルを全て結合してく れます!

  14. 14 取り込みの完了
 大容量データのマージも Exploratoryでは一瞬で完了します。

  15. 15 (補足)GoogleDriveにあるデータのインポート
 詳しい方法は下記白戸さんの記事が詳しいです。 https://exploratory.io/note/GMq1Qom5tS/Google-Drive-raT1FzF5fd ▪Google Driveにあるデータをインポートする方法

  16. ヒートマップを使って一緒に買われる商品の可視化

  17. 17 ヒートマップを使用したバスケット分析
 x軸とy軸に商品名を記載し、商品の組み合わせがどれだけ併せて購入されたかを色の濃淡で表現 https://note.com/yoheinotheyyo/n/n748d7421ac39 出典 こちらのヒートマップから 冷たいドリンクは総じて併売されやすい傾向にあり ますが、中でもファーストフードとよく併売されている ことが分かります。

  18. 18 単語の組み合わせを数える
 商品名を表す列に対し、テキストデータの加工 →単語の組み合わせを数えるを選択します。

  19. オーダーNO 商品名 数量 00000001 商品A 2 00000001 商品B 1 00000002

    商品C 1 00000002 商品D 1 19 (補足)単語の組み合わせを数える とは
 商品同士の購入組み合わせ回数を数えることができる機能です。 00000003 商品A 1 00000003 商品B 1 商品名.x 商品名.y 回数 商品A 商品B 2 商品C 商品D 1 商品名に対し、x、yという列が作られ、 x、yの組み合わせ毎の回数がカウントされる
  20. 20 ヒートマップ表示
 前述の「単語の組み合わせを数える」処理を行ったデータに対し、チャートタブにて下記設定。 ヒートマップデータが表示されます。 商品名.x 商品名.y 回数 商品A 商品B 2

    商品C 商品D 1 ・ ・ ・ 加工済みデータ (購入)回数の多い組み合 わせが赤く表示される。
  21. 21 ヒートマップの問題点
 単純な併売件数はわかるが、商品の特性上、一緒に購買されているように見えるだけで、実際には併売 効果のある商品がどれなのか判別がつきにくいのでは 商品D 商品C 商品B 商品A 商品A 商品B

    商品C 商品D (商品Aと商品B) スーツ上下のような基本的に両方購入 されることが前提の商品では。 (商品C) 一時期のマスクのように入荷しただけ 売れる人気商品なのでは。 クライアントと違い、自分のような外部の商品知識の薄い人間にとっては、併売効果のある商品とない商 品を見分けるのは一苦労で、やはり時間がかかってしまう可能性が高い。 →そこでExploratoryの白戸さんに助言を求めました。
  22. 22 白戸さんに聞いてみる
 Exploratoryで併売分析を行ういい方法ってありますか? マーケット・バスケット分析がおすすめです。 データの加工が必要ですよね? 不要です。 !!

  23. マーケット・バスケット分析

  24. マーケット・バスケット分析 
 1度の購買で、どの商品とどの商品を買ったのかという(あるいは商品カテゴリ 同士)、購入商品の「組み合 わせ」を分析する手法。 マーケット・バスケット分析とは? + + ビールとおつまみのような組み合わせは比較的誰でも想像しやすい かと思われます。 あるスーパーでは赤ちゃん用おむつとビールがよく一緒に購入されて

    いる事がわかりました。 おむつを購入しに来店した父親が一緒に自分のビールも購入したの ではと分析されています。 このように通常考え付かないような組み合わせの商品が一緒に購入されている事の発見に繋がります。
  25. マーケット・バスケット分析 -分析に必要なデータ-
 オーダーNO … 注文日 商品ID 商品名 数量 00000001 2019/04/01

    123456789 商品A 2 00000001 2019/04/01 1111111111 商品B 1 00000002 2019/04/01 987654321 商品C 1 データ1行がレシートでいうところの 明細になっている必要があります。 ご存じの通り、レシートは 1行毎に購入した商品の 名称と個数を印字されています。 バスケット分析に使用するデータも レシート(オー ダーNO)毎に購入商品の名称が記録されている 必要があります。
  26. 26 バスケット分析の実行
 ❶ ❷ ❸ ①マーケット・バスケット分析を選択 ②商品に該当する項目を選択 ③ユーザーの購入ID(買い物かごに入れた商品)に該当する項目を選択 設定方法 バスケット分析="よく一緒に買われる商品

    " を見つけるためのデータ分析。
  27. 27 バスケット分析の実行 -データ-
 # アイテムリスト 共に購入されるアイテム 支持度 確信度 リフト 1

    商品A 商品B 0.22 0.56 1.40 2 商品B 商品A 0.22 0.47 1.12 3 商品C 商品D 0.32 0.41 2.23 4 商品C 商品E 0.26 0.37 1.95 ・ ・ ・ バスケット分析を行うと下記のような形で結果が表示されます。
  28. 28 用語の説明
 # アイテムリスト 共に購入されるアイテム 支持度 確信度 リフト 1 商品A

    商品B 0.22 0.56 1.40 支持度(Support) 商品Aと商品Bを一緒に購入した人が 全体の中でどれくらいの割合か。 →商品Aと商品Bはどれくらいの割合で一緒に購入されているのか。 確信度(Confidence) 商品Aと商品Bを一緒に購入した人が 商品Aを購入した人の中でどれくらいの割合か。 →商品Aを購入した人はどれくらいの割合で商品 Bを購入しているのか。 リフト(Lift) 確信度を全体の中で商品 Bを購入した人の割合で割った時の値。 →商品Aを購入することで商品 Bの購入率が何倍上昇 (リフト)するか。
  29. 29 バスケット分析の実行 -グラフ-
 ちなみにグラフのタブでは下記のような図が表示されます。 商品D 商品B 商品A 商品C 商品E 商品F

    商品A 商品B 丸の大きさは「支持度」、 色の濃さは「確信度」を表現しています。 矢印の方向は「リフト値」を 表しています。 Aを購入した人はBも購入す る傾向にある。 商品数が多くなるとやや見づらくなるのが欠点です が、全体の流れを把握するには十分です。
  30. 30 バスケット分析の実行 -散布図-
 散布図では下記のような図が表示されます。 支持度 確 信 度 クリックすると 詳細が確認できます

    x軸が支持度、y軸が確信度を表しており、 丸の大きさがリフト値を表しています。 データの表組とは違い、各数値が可視化されてい るため、「ビールとおむつ」のような意外な組み合 わせを発見するのに向いています。
  31. 31 注意点
 + レジ袋 レジ袋など多くのユーザーが購入する商品 (?)の場合、 多くのユーザーが購入するため支持度、確信度は高くなるが、特定の商品と の結びつきは弱い為、リフト値は 1を大きく超えないと考えられます 例.支持度は高いが、確信度、リフト値は低い

    例.支持度、確信度は高いが、リフト値は低い 一方が人気のある商品やセット販売前提商品の場合、併売推奨商品として適当ではないと考えられます。 + プリンタ コピー用紙 コピー用紙は単体で購入するユーザーが多いため、確信度は低くなると 予想されますが、プリンタ購入の際にはセットで購入される機会が多いた め支持度は高くなる傾向にあります。 コピー用紙の購入自体にプリンタの購入意欲を高める効果は低いと考え られるため、リフト値は低くなります。
  32. 得られたインサイトと施策

  33. 33 得られたインサイト
 本件は予算の都合上、結果に関する分析レポートなどは作成しておりませんでしたが、 Exploratoryからいくつかの興味深い事象が見られました。 赤い丸で囲った部分は共通してとある商品 (商品X)が関 連しており、いくつかの関連のないジャンルの商品を購 入したユーザーは高い確率で 商品Xを購入している模 様。(=リフト値が高い)

    支持度自体は低く、商品 Xは単体ではあまり購入されて いない商品のため、まさに「ビール」と「おむつ」のような 組み合わせの商品といえます。 ※季節毎のパラメータで深堀したところ、春から夏にか けてこの傾向が強い。
  34. 34 施策の例
 多くのECサイトにはバスケット分析のロジックに則ったレコメンド機能が実装されており、そのようなサイト 自体のパフォーマンス向上には直接役立たないかもしれません。 ただし、運用側でセット販売の企画として利用したり、実店舗での商品配置として役立てたりと、販売の場 面で十分役立てることのできるデータとなるかと思います。 実店舗で配置を工夫できる セット販売で購入を促進

  35. 35 データをまとめてクライアントに展開
 ダッシュボードを作成し、クライアントに展開。 バスケット分析表だけでなく、ヒートマップと年、月で表示を切り替えられるパラメータも追加。 どの商品の組み合 わせが売れているか をヒートマップで可視 化

  36. 36 作業時間の比較
 データの形が違うため単純に比較はできませんが、 Excelによる作業では10時間以上かかっていたバス ケット分析が、Exploratoryでは1.5時間程度で完了しました。 エクセルによるデータ加工 Exploratoryを使用 使い方の調査で1時間ほどかかってい るため、実作業は30分未満

  37. 今後の取り組み

  38. 38 様々な分析手法とツールを使用し更なるドリルダウンを
 商品軸での分析の強化 商品だけでなく、商品を販売しているメーカー (ブランド)やカテゴリ毎にバスケット分析を 実施することで、 今まで気づかなかった特定のブランド同士やカテゴリ同士の相性などがわかるのでは。 ユーザー軸での分析の強化 GoogleAnalytics4では、収集した生データをそのまま BigQueryへと展開可能なので、

    ユーザー軸でのバスケット分析が可能になるのでは。 ・ユーザーの種別(店舗会員、EC会員、オムニチャネル会員 )での併売商品の違い ・RFM分析とバスケット分析を組み合わせたユーザーのランク毎の併売商品の違い ・閲覧ページと併売商品の相関性の深堀 etc...
  39. ご清聴ありがとうございました