$30 off During Our Annual Pro Sale. View Details »

マーケティング指標におけるデータサイエンス入門

Shingo Uto
November 20, 2022

 マーケティング指標におけるデータサイエンス入門

Panasonic様の有志団体の勉強会でお話させていただいた登壇資料です(資料は一部変更しています)

ビジネス領域で効果検証(因果推論)をしていく上で必要なマーケティング指標へのアプローチやデータサイエンス手法の応用例についてまとめています。

Shingo Uto

November 20, 2022
Tweet

More Decks by Shingo Uto

Other Decks in Business

Transcript

  1. マーケティング指標における データサイエンス入門

  2. 前提 - 聴き手のレベル感の想定 データサイエンス初学者or簡単な書籍を読んだことがあるくらいの 方々(ゴリゴリに専門書を読んでます的なレベルは想定していないで す) ▶ あえて厳密な表現をしていないところがあります

  3. アジェンダ - 前回のおさらい - マーケティング指標の紹介 - データサイエンスの概要 - データサイエンスのマーケティング領域への応用

  4. 前回のおさらい

  5. 相関関係と因果関係 相関関係の例 相関関係は必ずしも因果関係を表しているわけではない 因果関係の例 ビールの売上が大きいと アイスの売上も大きい傾向 学習時間を増やすと 試験の成績が上がる

  6. 因果関係の重要性 ビジネスシーンでは因果関係を知りたい(ことが多い) キャンペーン施策は利益につながったの? ➢ 因果関係が分からないと いつまで経っても意思決定を評価できない 広告を売ってるけど費用対効果はどうなの?

  7. 因果関係の難しいところ これって本当の効果? 広告の例:広告を見たグループと広告を見てないグループの売上を比較 売上 広告を見た 広告を見てない 現代の広告の多くは、売上に繋がりやすい人を ターゲティングして配信されている ➢ 広告を見ていなくても売上が高い

    「すべてが広告の効果」 というわけではない
  8. バイアス(セレクション・バイアス) バイアスを取り除いたものが本当の効果 広告の例:バイアス=広告を見ていなくても生じていたであろう売上の差 売上 広告を見た 広告を見てない 広告の効果(本当の効果) 広告を見ていなくても 生じていたであろう売上の差 (セレクション・バイアス)

  9. バイアスを除いた効果を推定するアプローチ(実験or非実験) 効果検証とは? 前回、紹介した手法 実験 - RCT(A/Bテスト) 非実験 - DID(差分の差分法) -

    RDD(回帰不連続デザイン)
  10. 前回、議論していない点 効果検証の流れ 1. 効果を定義する 2. (広義の)”データサイエンス”

  11. 今回、焦点を当てたい点 指標へのアプローチ どんな指標を見るべきか “データサイエンス”の具体例 どのように応用されているのか 〇〇アルゴリズム 〇〇分析

  12. 前回のおさらい(まとめ) - 相関関係と因果関係は混同してはいけない - 本当の効果って意外と分からない(バイアスだらけ) - 効果検証とは、バイアスを取り除いて本当の効果を推定するア プローチ - 今回は、効果を定義するための指標や評価するための”データ

    サイエンス”の応用例についてお話させていただきます。
  13. マーケティング指標の紹介

  14. マーケティング指標の紹介(前提) この章は、みなさんが知らないような「新しい指標を紹介する」と いうような内容ではありません。 (たぶん、私より詳しい人はたくさんいると思います(笑)) では、何を紹介する章なのか?? ➢ 「指標へのアプローチ」を紹介します!!

  15. いきなりですが、、、 みなさん、ダイエットをしたことはありますか?

  16. ダイエットあるある やみくもにダイエットを試みたものの、、、 運動 食事制限 気合十分 挫折 ➢ 「ダイエットに必要な指標を定量的に終えていない」ことが原因

  17. ダイエットで追うべき指標 ダイエットって実は非常にシンプル ※脂肪1kgを燃やすのに必要なカロリーは、約7,200キロカロリー 消費カロリーと摂取カロリーの指標を追えばよい ➢ 追うべき指標が分かると、解像度がグッと上がる!! 1日の消費カロリー 1日の摂取カロリー >

  18. マーケティング指標の話に戻ります 書籍「データ・ドリブン・マーケティング」で紹介されている指標 をベースにお話します 書籍の概要(Amazonの紹介文を一部抜粋) フォーチュン500社の業績上位20%の企業に共通する成功のカギは、データ解析にも とづくマーケティング(データドリブン・マーケティング)の意思決定であることがわ かっている。しかし日本では、各種メディアで「ビッグデータ」という言葉を目にし ない日はないほどだが、実際にはほとんどの企業がそれを売上・パフォーマンスの向 上に転換できていないのが現状である。その最大の理由は、そもそもどのような指標 が有効なのかを知らないことにある。

    著者が提言する15の指標による意思決定は、大規模なシステムや人的投資を必ずしも 必要とするものではない。内容を正しく理解した担当者が一人いればできることがほ とんどであるため、対象となる読者層の裾野は極めて広い。また、事例も豊富であ り、机上の理論に終わらず、実務家が明日から使える示唆・ノウハウに富んでいる。
  19. マーケティング活動の予算配分(平均値) 需要喚起が約5割を占める ※書籍「データ・ドリブン・マーケティング」の図表1.5を一部改変 マーケティング活動を5項目に分類 1. ブランディング 2. 市場形成 3. CRM

    4. ITインフラおよび組織能力 5. 需要喚起
  20. マーケティング活動の予算配分(業績別) 業績上位企業と業績下位企業で予算配分の割合は異なる ※書籍「データ・ドリブン・マーケティング」の図表1.6を改変 上が業績上位企業、下が業績下位企業の予算配分 業績上位企業の方が、業績下位企業より も中長期的な(需要喚起以外)マーケ ティング活動に予算を配分している割合 が高い

  21. ついつい、需要喚起関連の活動に重きを置いてしまう、、、 マーケティング活動あるある ➢ マーケティング活動の目的に合った評価指標を選択する必要 需要喚起 短期的な売上UP等などの繋がりや すく、効果や重要性を説明・理解 しやすい それ以外の活動 短期的には売上UP等に繋がらない

    ものが多く、効果や重要性を説明 ・理解しづらい
  22. マーケティング活動に合った評価指標 あくまでも参考 マーケティング活動 目的・カテゴリ 評価指標の例 ブランディング 認知向上 ブランド認知率 市場形成 比較検討・評価

    試乗(お試し)回数 CRM 顧客満足度 解約率、NPS ITインフラ等 運用効率 オファー承諾率 需要喚起 トライアル 売上高、財務系指標全般
  23. マーケティング活動に合った評価指標(補足) 赤枠部分は短期的な利益に繋がりにくいからこそ指標選定が鍵 マーケティング活動 目的・カテゴリ 評価指標の例 ブランディング 認知向上 ブランド認知率 市場形成 比較検討・評価

    試乗(お試し)回数 CRM 顧客満足度 解約率、NPS ITインフラ等 運用効率 オファー承諾率 需要喚起 トライアル 売上高、財務系指標全般
  24. マーケティングのバランス・スコアカード マーケティング施策を設計する際に3つの観点で考える必要がある 指標 概要 具体例 過去指標 具体的なキャンペーンや戦 術の効果を測る指標 売上高 リード・コンバージョン

    将来指標 先行指標となる測定値 ブランド認知率 LTV 内部プロセス管理指標 施策実行の効率性を測る指 標 オファー承諾率 費用対効果
  25. 指標に基づくマーケティング活動のプロセス マーケティング・キャンペーン・マネジメント(MCM)が鍵 効果測定 (測定) キャンペーンの 管理(実行) キャンペーンへ の投資(選択) フィードバック (適応学習)

  26. - マーケティング活動の成功確度を上げるためには、定量的な指 標を追う必要がある - マーケティング活動に合った指標選定がポイント。特に需要喚 起以外のマーケティング活動は短期的・直接的に売上に結びつ くことを確認しにくいケースが多いので、目的に合った指標選 定が重要 - マーケティング施策の設計には、スコアカードやマーケティン

    グ・キャンペーン・マネジメント(MCM)の導入を推奨 マーケティング指標の紹介(まとめ)
  27. データサイエンスの概要

  28. データサイエンスとは 統計学などの知見をもとにデータからインサイトを導き出すこと

  29. 本スライド内における”データサイエンス” 先ほどの定義に加えて、統計学・機械学習・最適化など広義の数理 的手法も含めて“データサイエンス”と表現 データサイエンス警察 ※「データサイエンス」という表 現は曖昧な便利ワードとして用い られがちなので、要注意です (正直、何が正解かは私も分かりません)

  30. 3大”データサイエンス”手法(あくまでも主観) - 統計学(統計解析) - 機械学習 - 数理最適化 ➢ 重なる部分も多く、厳密な棲み分けはない

  31. 統計学って何ができるの? 手元のデータを使って、母集団について考える イメージ: カレーの味見 味見で全部は食べない 小皿にすくって (鍋全体の)味を確認

  32. 統計学を用いた効果検証(カレーの例) いつものレシピに隠し味を入れて、味の変化を考える 隠し味入り 隠し味なし 味の差が隠し味の効果

  33. 機械学習って何ができるの? 手元のデータから学習し、ある値を予測する(教師あり学習) イメージ: カレーの味 じゃがいも 玉ねぎ にんじん お肉 カレールー 味

    aグラム bグラム cグラム dグラム eグラム
  34. 機械学習を用いた効果検証(カレーの例) 隠し味ありとなしの味の予測値の差を考える 隠し味入りの味の予測値 隠し味なしの味の予測値 予測値の差が隠し味の効果

  35. 数理最適化って何ができるの?(補足) データと制約条件から、ある値を最大(最小)にする配分を実現 イメージ: カレーをできるだけたくさん作る 甘口カレー4食分の具材 玉ねぎ1個 じゃがいも2個 にんじん2本 牛肉100g 甘口カレールー1個

    辛口カレー4食分の具材 玉ねぎ2個 じゃがいも2個 にんじん1本 牛肉200g 辛口カレールー1個 冷蔵庫(制約条件) 玉ねぎ6個 じゃがいも6個 にんじん6本 牛肉500g 甘口カレールー3個 辛口カレールー3個
  36. データサイエンスの概要(まとめ) - データサイエンスとは、統計学などの知見をもとにデータから インサイトを導き出すこと - 統計学、機械学習、数理最適化でできること - 統計学: 手元のデータから母集団を考えることができる -

    機械学習: 手元のデータから予測できる(教師あり学習) - 数理最適化: 手元のデータと制約条件からある値を最大(最小) にする配分を実現することができる
  37. データサイエンスの マーケティング領域への応用

  38. 本スライドで紹介する4つの手法 - 回帰分析 - ネクストベスト・オファーモデル分析 - 決定木分析 - LiNGAMモデル分析

  39. 回帰分析 いい感じの回帰直線を考えて、効果を推定する手法 イメージ: キャンペーン施策の平均売上効果 売上高の指標に注目 - 縦軸: 平均売上の推定値(単位: 円) -

    横軸: 年齢(単位: 歳) - 効果: 2直線の差 キャンペーンには売上を平均1,000円上げ る効果があると解釈
  40. 回帰分析(補足) 前回、紹介した手法も回帰分析の枠組み 差分の差分法(DID) t4時点でキャンペーンを実施 - 縦軸: 平均売上の推定値(単位: 円) - 横軸:

    時点(t1, t2, t3, t4) - 効果: t4時点のキャンペーンありの実 線と破線の差
  41. 回帰分析(補足) 前回、紹介した手法も回帰分析の枠組み 回帰不連続デザイン(RDD) 累計ポイントが1,000ポイント以上の顧 客にだけキャンペーンを実施 - 縦軸: 平均売上の推定値(単位: 円) -

    横軸: 累計ポイント - 効果: 累計ポイントが1,000ポイント 付近の平均売上の差
  42. 回帰分析(メリット・デメリット) 回帰分析のメリットとデメリット メリット - 考え方が比較的シンプルなため、受け入れられやすい - 汎用性が高い デメリット - 変数の選択などが実は難しく、誤用されやすい

  43. ネクストベスト・オファーモデル 既存の顧客の購入意欲を点数化し、1番点数の高いものを提案する Eメールによる販促 Eメールで提案 最も購入意欲が高い 商品を提案 モデルの作成 ロジスティック回帰 モデルなど データ蓄積

    過去の購買履歴など の属性データ 効果測定 オファー承諾率など モデルは定期的に 更新する
  44. ネクストベスト・オファーモデル(補足) 似た手法に「アソシエーション分析」がある(クラスター分析) 顧客がどんな商品やサービスを同時に購入するかを特定する分析手法 (例)野球のグローブを購入する人に野球ボールやバットをレコメンド

  45. ネクストベスト・オファーモデル(メリ・デメ) ネクストベスト・オファーモデルのメリット・デメリット メリット - 分析結果に基づいたEメール配信など、一度実装すればネクストアクションま で自動化することが可能 デメリット - 分析結果が視覚的に分かりにくい -

    データ基盤などのITインフラ整備が必要
  46. 決定木分析 データに基づいてルールを設定し、木構造に分類する 解約率が高い顧客を割り出す 全顧客1,000人 解約率10.0% 顧客数500人 解約率5.0% 顧客数500人 解約率15.0% 顧客数100人(解約率9.0%)

    顧客数400人(解約率4.0%) 顧客数200人(解約率21.0%) 顧客数300人(解約率11.0%) この顧客層に刺さるネクスト アクションを考える Yes No 例)顧客ランクが〜以上
  47. 決定木分析(メリット・デメリット) 決定木分析のメリット・デメリット メリット - 視覚的に理解しやすい - 幅広いケースでアプローチが可能 デメリット - モデルの過学習の懸念

  48. LiNGAMモデル分析 いい感じのモデルを考えて、各要素の影響度合いを推定 イメージ 求めたい関係式 - x = 2y + a

    - y = b - z = 3x + 4y + c ※a,b,cは誤差(ノイズ) 変数y 変数x 変数z ×2 ×4 ×3 ➢ 矢印と赤の数字たちを知りたい LiNGAMの由来 必要な仮定の頭文字 - Linear: 線形 - Non-Gaussian: (誤差項が)ガウス分布 に従わない - Acyclic: 非循環(な因果グラフで表すこ とができる) - Model: モデル
  49. LiNGAMモデル分析(メリット・デメリット) LiNGAMモデル分析のメリット・デメリット メリット - 視覚的に理解しやすい デメリット - 前提条件が厳しい

  50. DSのマーケティング領域への応用(まとめ) - 回帰分析、ネクストベスト・オファーモデル分析、決定木分 析、LiNGAMモデル分析などを紹介 - いずれの手法にもメリット・デメリットがあるため、目的に合 わせた手法選定が必要

  51. おわりに

  52. 参考文献 - マーク・ジェフリー「データ・ドリブン・マーケティング」ダ イヤモンド社(2017) - 安井「効果検証入門」ホクソエム社(2020) - Ron Kohavi他「ABテスト実践ガイド」ドワンゴ(2021) -

    小川「Pythonによる因果分析」マイナビ出版(2021) - 佐藤「マーケティングの統計モデル」朝倉書店(2015)
  53. ご清聴ありがとうございました