2021/8/20(金)に開催したExploratory データサイエンス勉強会#20の株式会社エートゥジェイ様のご登壇資料です。
Copyright © Atoj. All Rights ReservedCONFIDENTIALマーケット・バスケット分析を活用したECサイトの購買分析 2021.08.20 株式会社AtoJ 佐藤 史渉
View Slide
2会社概要 会社名 株式会社エートゥジェイ / AtoJ,Inc. 設立 2007年3月9日 所在地 東京都港区南青山2-2-8 南青山DFビル 8階 TEL 03-5772-2581 FAX 03-5772-2582 資本金 132,375,000円 従業員数 62名(業務委託、外部協力会社含まず) 代表者 代表取締役社長 飯澤 満育(マイク)
3会社概要
4会社概要
5自己紹介 名前:佐藤 史渉(さとう ふみあき)所属:Webソリューション第1局(2018年2月入社)業務内容:Webサイトの制作ディレクション、 ECサイトの分析・運用・施策提案■Exploratryとの出会いGoogleAnalytics以外でサイト分析に使えるツールはないか探していたところ、株式会社プリンシプルのセミナーを聴講したのをきっかけに Exploratoryの存在を知り、時系列予測の機能など様々な分析・解析技術や技法を簡単に試すことができる事 に惹かれ上長にかけあい導入させていただきました。
6AGENDA 1. 今回の発表の背景2. ヒートマップを使って一緒に買われる商品の可視化3. マーケット・バスケット分析4. 得られたインサイトと施策5. 今後の取り組み
今回の発表の背景
約300,000件(3年分)のデータ8今回の発表の背景 -取引先からの依頼- 当社のECサイトの3年分の売上データから、よく併売されている商品のリスト を作成してほしい。できれば3年まとめたものと1年毎のデータに分けてほしい。某企業2021年6月 このような依頼を取引先企業からいただきました。佐藤2019 2020 2021
9今回の発表の背景 -過去のトラウマ- 購入日 ユーザーID 購入商品 数量2018/01/10 〇〇〇〇〇〇 デスク 12018/01/10 〇〇〇〇〇〇 チェア 12018/05/12 △△△△△△ ベッド 12018/07/01 XXXXXXXXX 枕カバー 22018/07/05 △△△△△△ テーブル 1ユーザーID 購入商品1回目数量 購入商品2回目数量〇〇〇〇〇〇 デスク、チェア2△△△△△△ ベッド 1 テーブル 1XXXXXXXXX 枕カバー 2エクセルで約200,000件のデータを関数やマクロを駆使して、①の元データを②のような形に成型する必要がありました。※実際は会員種別や購入場所 (店舗、EC)など細かく分かれており複雑でした。① ②まだExploratoryの存在をしらなかった 2019年。今回とは別のとある家具系 ECサイトの提案書作成の過程で、バスケット分析を行う必要があったのですが。。。。
10今回の発表の背景 -エクセルの限界- そもそも200,000件はエクセルで処理できるデータ量ではなく 、セルに仕込んだSUMIF関数やVLOOKUP関数などで画面が固まること多数。結局年毎にデータを分割し、多くのメモリを消費する関数は随時コピー →値を貼りつけで削除…etc最終的に年毎のデータを統合する事で何とかデータ加工終了。(データ加工だけで作業時間約10時間以上。その内数時間はエクセルが落ちる、処理が固まるなどによるトラブル )今回はユーザーは関係なく、商品だけの単純なバスケット分析ではあるけど、大量のデータの処理はもうやりたくない。断ろうか・・・
11今回の発表の背景 -それExploratoryで解決できるかも- データの取り込みExploratoryへの連携可視化Exploratoryかゆいところまで手が届く Exploratoryにデータを渡せば、うまいこと解決できるのでは?GoogleDriveExcel取り込み先としては色々なツールがありますが、GoogleDriveが最も一般的に利用されている事とGoogle Driveにファイルを保存することで、Exploratory側からインサイトをスケジュールすることができるため、クライアントの協力が得やすいかと存じます。
12データの取り込み先を指定 データフレーム→ファイルデータを選択し、右端の Googleドライブ→エクセルファイルを選択
13指定のテーブルからデータを取り込み アカウントへの権限の付与終了後、該当アカウントに格納されている売上データを取り込むあらかじめGoogleDriveに格納した売上データインポート&マージを選択すると選択したファイルを全て結合してくれます!
14取り込みの完了 大容量データのマージも Exploratoryでは一瞬で完了します。
15(補足)GoogleDriveにあるデータのインポート 詳しい方法は下記白戸さんの記事が詳しいです。https://exploratory.io/note/GMq1Qom5tS/Google-Drive-raT1FzF5fd■Google Driveにあるデータをインポートする方法
ヒートマップを使って一緒に買われる商品の可視化
17ヒートマップを使用したバスケット分析 x軸とy軸に商品名を記載し、商品の組み合わせがどれだけ併せて購入されたかを色の濃淡で表現https://note.com/yoheinotheyyo/n/n748d7421ac39出典こちらのヒートマップから冷たいドリンクは総じて併売されやすい傾向にありますが、中でもファーストフードとよく併売されていることが分かります。
18単語の組み合わせを数える 商品名を表す列に対し、テキストデータの加工 →単語の組み合わせを数えるを選択します。
オーダーNO 商品名 数量00000001 商品A 200000001 商品B 100000002 商品C 100000002 商品D 119(補足)単語の組み合わせを数える とは 商品同士の購入組み合わせ回数を数えることができる機能です。00000003 商品A 100000003 商品B 1商品名.x 商品名.y 回数商品A 商品B 2商品C 商品D 1商品名に対し、x、yという列が作られ、x、yの組み合わせ毎の回数がカウントされる
20ヒートマップ表示 前述の「単語の組み合わせを数える」処理を行ったデータに対し、チャートタブにて下記設定。ヒートマップデータが表示されます。商品名.x 商品名.y 回数商品A 商品B 2商品C 商品D 1・・・加工済みデータ(購入)回数の多い組み合わせが赤く表示される。
21ヒートマップの問題点 単純な併売件数はわかるが、商品の特性上、一緒に購買されているように見えるだけで、実際には併売効果のある商品がどれなのか判別がつきにくいのでは商品D商品C商品B商品A商品A 商品B 商品C 商品D(商品Aと商品B)スーツ上下のような基本的に両方購入されることが前提の商品では。(商品C)一時期のマスクのように入荷しただけ売れる人気商品なのでは。クライアントと違い、自分のような外部の商品知識の薄い人間にとっては、併売効果のある商品とない商品を見分けるのは一苦労で、やはり時間がかかってしまう可能性が高い。→そこでExploratoryの白戸さんに助言を求めました。
22白戸さんに聞いてみる Exploratoryで併売分析を行ういい方法ってありますか?マーケット・バスケット分析がおすすめです。データの加工が必要ですよね?不要です。!!
マーケット・バスケット分析
マーケット・バスケット分析 1度の購買で、どの商品とどの商品を買ったのかという(あるいは商品カテゴリ 同士)、購入商品の「組み合わせ」を分析する手法。マーケット・バスケット分析とは?++ビールとおつまみのような組み合わせは比較的誰でも想像しやすいかと思われます。あるスーパーでは赤ちゃん用おむつとビールがよく一緒に購入されている事がわかりました。おむつを購入しに来店した父親が一緒に自分のビールも購入したのではと分析されています。このように通常考え付かないような組み合わせの商品が一緒に購入されている事の発見に繋がります。
マーケット・バスケット分析 -分析に必要なデータ- オーダーNO … 注文日 商品ID 商品名 数量00000001 2019/04/01 123456789 商品A 200000001 2019/04/01 1111111111 商品B 100000002 2019/04/01 987654321 商品C 1データ1行がレシートでいうところの 明細になっている必要があります。ご存じの通り、レシートは 1行毎に購入した商品の名称と個数を印字されています。バスケット分析に使用するデータも レシート(オーダーNO)毎に購入商品の名称が記録されている必要があります。
26バスケット分析の実行 ❶❷❸①マーケット・バスケット分析を選択②商品に該当する項目を選択③ユーザーの購入ID(買い物かごに入れた商品)に該当する項目を選択設定方法バスケット分析="よく一緒に買われる商品 " を見つけるためのデータ分析。
27バスケット分析の実行 -データ- # アイテムリスト 共に購入されるアイテム 支持度 確信度 リフト1 商品A 商品B 0.22 0.56 1.402 商品B 商品A 0.22 0.47 1.123 商品C 商品D 0.32 0.41 2.234 商品C 商品E 0.26 0.37 1.95・・・バスケット分析を行うと下記のような形で結果が表示されます。
28用語の説明 # アイテムリスト 共に購入されるアイテム 支持度 確信度 リフト1 商品A 商品B 0.22 0.56 1.40支持度(Support)商品Aと商品Bを一緒に購入した人が 全体の中でどれくらいの割合か。→商品Aと商品Bはどれくらいの割合で一緒に購入されているのか。確信度(Confidence)商品Aと商品Bを一緒に購入した人が 商品Aを購入した人の中でどれくらいの割合か。→商品Aを購入した人はどれくらいの割合で商品 Bを購入しているのか。リフト(Lift)確信度を全体の中で商品 Bを購入した人の割合で割った時の値。→商品Aを購入することで商品 Bの購入率が何倍上昇 (リフト)するか。
29バスケット分析の実行 -グラフ- ちなみにグラフのタブでは下記のような図が表示されます。商品D商品B商品A商品C商品E商品F商品A商品B丸の大きさは「支持度」、色の濃さは「確信度」を表現しています。矢印の方向は「リフト値」を表しています。Aを購入した人はBも購入する傾向にある。商品数が多くなるとやや見づらくなるのが欠点ですが、全体の流れを把握するには十分です。
30バスケット分析の実行 -散布図- 散布図では下記のような図が表示されます。支持度確信度クリックすると詳細が確認できますx軸が支持度、y軸が確信度を表しており、丸の大きさがリフト値を表しています。データの表組とは違い、各数値が可視化されているため、「ビールとおむつ」のような意外な組み合わせを発見するのに向いています。
31注意点 +レジ袋レジ袋など多くのユーザーが購入する商品 (?)の場合、多くのユーザーが購入するため支持度、確信度は高くなるが、特定の商品との結びつきは弱い為、リフト値は 1を大きく超えないと考えられます例.支持度は高いが、確信度、リフト値は低い例.支持度、確信度は高いが、リフト値は低い一方が人気のある商品やセット販売前提商品の場合、併売推奨商品として適当ではないと考えられます。+プリンタコピー用紙コピー用紙は単体で購入するユーザーが多いため、確信度は低くなると予想されますが、プリンタ購入の際にはセットで購入される機会が多いため支持度は高くなる傾向にあります。コピー用紙の購入自体にプリンタの購入意欲を高める効果は低いと考えられるため、リフト値は低くなります。
得られたインサイトと施策
33得られたインサイト 本件は予算の都合上、結果に関する分析レポートなどは作成しておりませんでしたが、Exploratoryからいくつかの興味深い事象が見られました。赤い丸で囲った部分は共通してとある商品 (商品X)が関連しており、いくつかの関連のないジャンルの商品を購入したユーザーは高い確率で 商品Xを購入している模様。(=リフト値が高い)支持度自体は低く、商品 Xは単体ではあまり購入されていない商品のため、まさに「ビール」と「おむつ」のような組み合わせの商品といえます。※季節毎のパラメータで深堀したところ、春から夏にかけてこの傾向が強い。
34施策の例 多くのECサイトにはバスケット分析のロジックに則ったレコメンド機能が実装されており、そのようなサイト自体のパフォーマンス向上には直接役立たないかもしれません。ただし、運用側でセット販売の企画として利用したり、実店舗での商品配置として役立てたりと、販売の場面で十分役立てることのできるデータとなるかと思います。実店舗で配置を工夫できる セット販売で購入を促進
35データをまとめてクライアントに展開 ダッシュボードを作成し、クライアントに展開。バスケット分析表だけでなく、ヒートマップと年、月で表示を切り替えられるパラメータも追加。どの商品の組み合わせが売れているかをヒートマップで可視化
36作業時間の比較 データの形が違うため単純に比較はできませんが、 Excelによる作業では10時間以上かかっていたバスケット分析が、Exploratoryでは1.5時間程度で完了しました。エクセルによるデータ加工Exploratoryを使用使い方の調査で1時間ほどかかっているため、実作業は30分未満
今後の取り組み
38様々な分析手法とツールを使用し更なるドリルダウンを 商品軸での分析の強化商品だけでなく、商品を販売しているメーカー (ブランド)やカテゴリ毎にバスケット分析を 実施することで、今まで気づかなかった特定のブランド同士やカテゴリ同士の相性などがわかるのでは。ユーザー軸での分析の強化GoogleAnalytics4では、収集した生データをそのまま BigQueryへと展開可能なので、ユーザー軸でのバスケット分析が可能になるのでは。・ユーザーの種別(店舗会員、EC会員、オムニチャネル会員 )での併売商品の違い・RFM分析とバスケット分析を組み合わせたユーザーのランク毎の併売商品の違い・閲覧ページと併売商品の相関性の深堀 etc...
ご清聴ありがとうございました