Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マーケティング×データ分析

 マーケティング×データ分析

2023年6月7日(水)にITスクール「RareTECH」様で「マーケティング×データ分析」についてお話しさせていただきました.

ぜひ,ご一読いただけますと幸いです.

RareTECH様の公式サイトはこちら.
https://raretech.site/

Githubリンクはこちら.
https://github.com/s1ok69oo/LT_rep/tree/main/RareTECH_lecture_20230607

うとしん

June 07, 2023
Tweet

More Decks by うとしん

Other Decks in Science

Transcript

  1. - やること - データサイエンスに関連する用語のざっっっくりとした説明 - データサイエンスのマーケティングへの応用例の紹介 - 簡単なPythonのコードの実行 - やらないこと

    - データサイエンスに関連する用語・理論等の詳細な話 - 「マーケティングとは!」みたいな話 - 複雑なPythonの処理 やること・やらないこと なんとなく「データサイエンスってこんなことができるんだ」くらいの ふわっとした理解度に到達するのが今回のゴールです!
  2. 3大”データサイエンス”手法(あくまでも主観) - 統計学 - 機械学習 - 教師あり学習 - 教師なし学習 -

    (強化学習) - 数理最適化 > 厳密な棲み分けはない これらの理論は 「画像処理」「音声認識」「自然言語処理」「異常検知」 などをはじめ,多岐に渡って応用されている 最近流行りのChatGPTなども”データサイエンス”の応用
  3. 数理最適化って何ができるの? データと制約条件から,ある値を最大(最小)にする配分を実現 イメージ: カレーをできるだけたくさん作る 甘口カレー4食分の具材 玉ねぎ1個 じゃがいも2個 にんじん2本 牛肉100g 甘口カレールー1個

    辛口カレー4食分の具材 玉ねぎ2個 じゃがいも2個 にんじん1本 牛肉200g 辛口カレールー1個 冷蔵庫 玉ねぎ6個 じゃがいも6個 にんじん6本 牛肉500g 甘口カレールー3個 辛口カレールー3個 制約条件 データ
  4. データサイエンスの概要(まとめ) - データサイエンスとは、統計学などの知見をもとにデータから インサイトを導き出すこと - 統計学、機械学習、数理最適化でできること - 統計学: 手元のデータから母集団を考える -

    機械学習: 手元のデータから予測・手元のデータをグルーピング - 数理最適化: 手元のデータと制約条件からある値を最大(最小) にする配分を実現
  5. RFM分析とは 顧客の購買行動履歴を - Recency: 直近の店舗やメディアへの来訪,商品の購入 - Frequency: 期間内の来訪や購入の頻度 - Monetary:

    期間内の累積購買金額 の3点から,顧客を評価・分類する分析アプローチ 基本的には,Recencyは小さいほど, FrequencyとMonetaryは大きいほど”優良顧客”と言える ※Recencyの大小は観察 日時と直近の購買日時の 差を表しています.
  6. RFM分析のセグメント 最も簡単なセグメントの分け方は以下の4パターン 1. Recency: 小,Frequency・Monetary: 大 2. Recency: 小,Frequency・Monetary: 小

    3. Recency: 大,Frequency・Monetary: 大 4. Recency: 大,Frequency・Monetary: 小 > 例えば,1の場合「優良顧客」と判定し,マーケティング戦略としてこの 顧客に好まれるような商品やサービスの開発などを考える必要がある. ※セグメントとは「グループ」みたいな意味です
  7. 問題の回答例 問題1: R, F, Mすべて小さい 顧客 マーケティング戦略 新規顧客 リピートに繋げる施策 (e.g)メルマガ配信など

    特定の目的にだけ利用している顧客 (e.g)化粧品会社で化粧水だけ購入する男性 クロスセルやアップセル (e.g)乳液や高品質で高単価の化粧水の販売 顧客 マーケティング戦略 過去は優良顧客であったが,他の競合サービス に移ってしまった顧客 自社サービスの再購入を促すプロモーション (e.g)割引クーポンの配布など 問題2: R, F, Mすべて大きい ※あくまでも回答例です.これ以外の回答が間違いというわけではありません.
  8. 機械学習モデル(予測モデル)の構築手順 大まかな流れ 1. データを準備(データの収集から前処理まで) 2. 訓練データとテストデータに分割 3. モデルを選定 4. 訓練データを学習

    5. モデルの精度を評価 6. 必要に応じてパラメータ調整や1~5を繰り返して,より精度を上げる > 予測モデルの中でも分類モデルを例に,1~5についてサラっと説明
  9. 全データで学習してしまうと未知のデータに対する予測精度を評価 できないため,データを2つに分割 2: 訓練データとテストデータに分割する 全データ 訓練データ テストデータ 分割 モデル 学習

    予測値 予測 評価 ※もう少しテクニカルな分割方法もありますが,割愛させていただきます テストデータを未知 のデータとして扱う
  10. 用途に応じて1つor複数のモデルを選定する 3: モデルを選定する 教師あり学習 回帰モデル - 線形回帰モデル - 決定木 など

    教師なし学習 - 主成分分析 - k-means など 分類モデル - ロジスティック回帰モデル - 決定木 など 予測モデルで利用するのは教師あり学習. とくに,今回は分類モデルを利用します.
  11. 4: 訓練データで学習 Pythonでは次のようなライブラリがある - scikit-learn(通称: sklearn) - XGBoost - LightGBM

    - PyCaret など (cf)深層学習用のフレームワーク TensorFlow, Keras, PyTorch, Chainer など
  12. 5: モデルの精度を評価 分類モデルの基本的な4つの評価指標 > 正解率・適合率・再現率・F値 予測結果 陽性 陰性 実際 陽性

    真陽性 (TP) 偽陰性 (FN) 陰性 偽陽性 (FP) 真陰性 (TN) 略称)T: True, F: False, P: Positive, N: Negative > 正解率: 全データのうち予測が正しかった割合 (TP + TN) / (TP + FP + FN + TN) > 適合率: 陽性と予測し実際に陽性だった割合 TP / (TP + FP) > 再現率: 実際は陽性の中で陽性と予測できた割合 TP / (TP + FN) > F値: 適合率と再現率の調和平均 2 / {(1/適合率) + (1/再現率)}
  13. キャンペーンと効果検証 キャンペーンと効果検証はセット(であるべき) キャンペーン 本スライドでは「非永続的なマーケ ティング施策全般」と定義 (e.g) 割引クーポンの配布 など ※キャンペーンを実施して終わりではなく, 効果検証の結果を受けて,以降の意思決定や

    キャンペーン立案に反映させる 効果検証 言葉の通り,キャンペーンを実施した 際の”効果”を検証・測定すること (e.g) 割引クーポンを配布して,売上に 繋がったのか?どれくらい売上に繋 がったのか? ※”効果”の定義はキャンペーン毎に異なる このサイクルを回すことが重要
  14. Recencyの大きいユーザーに割引クーポンを配布して,再び自社メ ディアの商品・サービスを購入させたい! > 何も考えず割引クーポンの有無でユーザーを売上を比較するとこうなる たとえば,こんなケース(ナイーブな”効果”) ひと月の売上/人 Recency小 (クーポンなし) Recency大 (クーポンあり)

    > 割引クーポン有の方が,ひと月の売上が低い > 割引クーポンは逆効果...? > 答えは「No!」なぜなら,クーポンの有無に 関係なく「Recencyが大きい」=「直近の売上 が低い」ユーザーであるため 逆効果...?