Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マーケット・バスケット分析を活用したECサイトの購買分析

 マーケット・バスケット分析を活用したECサイトの購買分析

2021/8/20(金)に開催したExploratory データサイエンス勉強会#20の株式会社エートゥジェイ様のご登壇資料です。

Ikuya Murasato

August 20, 2021
Tweet

More Decks by Ikuya Murasato

Other Decks in Business

Transcript

  1. 2 会社概要
 会社名
 株式会社エートゥジェイ / AtoJ,Inc. 
 設立
 2007年3月9日
 所在地


    東京都港区南青山2-2-8 南青山DFビル 8階 
 TEL 03-5772-2581 
 FAX 03-5772-2582 
 資本金
 132,375,000円
 従業員数
 62名(業務委託、外部協力会社含まず) 
         代表者 
 代表取締役社長 飯澤 満育(マイク) 

  2. 9 今回の発表の背景 -過去のトラウマ-
 購入日 ユーザーID 購入商品 数量 2018/01/10 〇〇〇〇〇〇 デスク 1

    2018/01/10 〇〇〇〇〇〇 チェア 1 2018/05/12 △△△△△△ ベッド 1 2018/07/01 XXXXXXXXX 枕カバー 2 2018/07/05 △△△△△△ テーブル 1 ユーザーID 購入商品 1回目 数量 購入商品 2回目 数量 〇〇〇〇〇〇 デスク 、チェア 2 △△△△△△ ベッド 1 テーブル 1 XXXXXXXXX 枕カバー 2 エクセルで約200,000件のデータを関数やマクロを駆使して、 ①の元データを②のような形に成型する必要がありました。 ※実際は会員種別や購入場所 (店舗、EC)など細かく分かれており複雑でした。 ① ② まだExploratoryの存在をしらなかった 2019年。今回とは別のとある家具系 ECサイトの提案書作成の過 程で、バスケット分析を行う必要があったのですが。。。。
  3. 11 今回の発表の背景 -それExploratoryで解決できるかも-
 データの 取り込み Exploratory への連携 可視化 Exploratory かゆいところまで手が届く Exploratoryにデータを渡せば、

    うまいこと解決できるのでは? GoogleDrive Excel 取り込み先としては色々なツールがありますが、 GoogleDriveが最も一般的に利用されている事と Google Driveにファイルを保存することで、 Exploratory側からインサイトをスケジュールすることができるため、 クライアントの協力が得やすいかと存じます。
  4. オーダーNO 商品名 数量 00000001 商品A 2 00000001 商品B 1 00000002

    商品C 1 00000002 商品D 1 19 (補足)単語の組み合わせを数える とは
 商品同士の購入組み合わせ回数を数えることができる機能です。 00000003 商品A 1 00000003 商品B 1 商品名.x 商品名.y 回数 商品A 商品B 2 商品C 商品D 1 商品名に対し、x、yという列が作られ、 x、yの組み合わせ毎の回数がカウントされる
  5. 21 ヒートマップの問題点
 単純な併売件数はわかるが、商品の特性上、一緒に購買されているように見えるだけで、実際には併売 効果のある商品がどれなのか判別がつきにくいのでは 商品D 商品C 商品B 商品A 商品A 商品B

    商品C 商品D (商品Aと商品B) スーツ上下のような基本的に両方購入 されることが前提の商品では。 (商品C) 一時期のマスクのように入荷しただけ 売れる人気商品なのでは。 クライアントと違い、自分のような外部の商品知識の薄い人間にとっては、併売効果のある商品とない商 品を見分けるのは一苦労で、やはり時間がかかってしまう可能性が高い。 →そこでExploratoryの白戸さんに助言を求めました。
  6. マーケット・バスケット分析 -分析に必要なデータ-
 オーダーNO … 注文日 商品ID 商品名 数量 00000001 2019/04/01

    123456789 商品A 2 00000001 2019/04/01 1111111111 商品B 1 00000002 2019/04/01 987654321 商品C 1 データ1行がレシートでいうところの 明細になっている必要があります。 ご存じの通り、レシートは 1行毎に購入した商品の 名称と個数を印字されています。 バスケット分析に使用するデータも レシート(オー ダーNO)毎に購入商品の名称が記録されている 必要があります。
  7. 27 バスケット分析の実行 -データ-
 # アイテムリスト 共に購入されるアイテム 支持度 確信度 リフト 1

    商品A 商品B 0.22 0.56 1.40 2 商品B 商品A 0.22 0.47 1.12 3 商品C 商品D 0.32 0.41 2.23 4 商品C 商品E 0.26 0.37 1.95 ・ ・ ・ バスケット分析を行うと下記のような形で結果が表示されます。
  8. 28 用語の説明
 # アイテムリスト 共に購入されるアイテム 支持度 確信度 リフト 1 商品A

    商品B 0.22 0.56 1.40 支持度(Support) 商品Aと商品Bを一緒に購入した人が 全体の中でどれくらいの割合か。 →商品Aと商品Bはどれくらいの割合で一緒に購入されているのか。 確信度(Confidence) 商品Aと商品Bを一緒に購入した人が 商品Aを購入した人の中でどれくらいの割合か。 →商品Aを購入した人はどれくらいの割合で商品 Bを購入しているのか。 リフト(Lift) 確信度を全体の中で商品 Bを購入した人の割合で割った時の値。 →商品Aを購入することで商品 Bの購入率が何倍上昇 (リフト)するか。
  9. 29 バスケット分析の実行 -グラフ-
 ちなみにグラフのタブでは下記のような図が表示されます。 商品D 商品B 商品A 商品C 商品E 商品F

    商品A 商品B 丸の大きさは「支持度」、 色の濃さは「確信度」を表現しています。 矢印の方向は「リフト値」を 表しています。 Aを購入した人はBも購入す る傾向にある。 商品数が多くなるとやや見づらくなるのが欠点です が、全体の流れを把握するには十分です。
  10. 30 バスケット分析の実行 -散布図-
 散布図では下記のような図が表示されます。 支持度 確 信 度 クリックすると 詳細が確認できます

    x軸が支持度、y軸が確信度を表しており、 丸の大きさがリフト値を表しています。 データの表組とは違い、各数値が可視化されてい るため、「ビールとおむつ」のような意外な組み合 わせを発見するのに向いています。
  11. 31 注意点
 + レジ袋 レジ袋など多くのユーザーが購入する商品 (?)の場合、 多くのユーザーが購入するため支持度、確信度は高くなるが、特定の商品と の結びつきは弱い為、リフト値は 1を大きく超えないと考えられます 例.支持度は高いが、確信度、リフト値は低い

    例.支持度、確信度は高いが、リフト値は低い 一方が人気のある商品やセット販売前提商品の場合、併売推奨商品として適当ではないと考えられます。 + プリンタ コピー用紙 コピー用紙は単体で購入するユーザーが多いため、確信度は低くなると 予想されますが、プリンタ購入の際にはセットで購入される機会が多いた め支持度は高くなる傾向にあります。 コピー用紙の購入自体にプリンタの購入意欲を高める効果は低いと考え られるため、リフト値は低くなります。
  12. 38 様々な分析手法とツールを使用し更なるドリルダウンを
 商品軸での分析の強化 商品だけでなく、商品を販売しているメーカー (ブランド)やカテゴリ毎にバスケット分析を 実施することで、 今まで気づかなかった特定のブランド同士やカテゴリ同士の相性などがわかるのでは。 ユーザー軸での分析の強化 GoogleAnalytics4では、収集した生データをそのまま BigQueryへと展開可能なので、

    ユーザー軸でのバスケット分析が可能になるのでは。 ・ユーザーの種別(店舗会員、EC会員、オムニチャネル会員 )での併売商品の違い ・RFM分析とバスケット分析を組み合わせたユーザーのランク毎の併売商品の違い ・閲覧ページと併売商品の相関性の深堀 etc...