Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Google製OSS「Meridian」を用いた広告予算最適化:MMM実装検証レポート【Pyt...

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.
Avatar for 月ねこAI 月ねこAI
December 15, 2025

Google製OSS「Meridian」を用いた広告予算最適化:MMM実装検証レポート【Python / ベイズ推定】

Googleが公開した新しいMMM(マーケティング・ミックス・モデリング)用オープンソースライブラリ「Meridian」を用いた実装検証レポートです。
GitHubの公開データセット(Shenzhen TV Data)を使用し、因果推論アプローチによる広告効果の推定と予算配分の最適化シミュレーションを行いました。

【本資料の主なトピック】
・Meridianと他ライブラリ(Robyn, LightweightMMM)の比較選定
・データの前処理:相関チェック、STL分解、VIFによる多重共線性確認
・モデル診断:R-hatによる収束確認、事後分布の検証
・分析結果:チャネル別ROIの算出、貢献度(Contribution)の可視化
・予算最適化:投資対効果を最大化するための予算再配分シミュレーション

【こんな方におすすめ】
・マーケティングサイエンス、データ分析に携わっている方
・Cookie規制後の広告効果測定(MMM)に関心がある方
・Google Meridianの具体的な出力結果や活用イメージを知りたい方

Author: 月ねこAI (Marketing Data Analyst)

Avatar for 月ねこAI

月ねこAI

December 15, 2025
Tweet

More Decks by 月ねこAI

Other Decks in Technology

Transcript

  1. 2 ⽬次 2 3 4 ‧‧‧ ‧‧‧ ‧‧‧ 1 ‧‧‧

    マーケティング‧ミックス‧モデリングとは? 分析データの詳細と課題 モデル診断 結果 5 ‧‧‧ 予算の最適化 6 ‧‧‧ 振り返り
  2. 3 ©2017-2025 kikagaku, Inc. All Rights Reserved. 3 1.マーケティングミックスモデリング(MMM)とは •

    MMMとは • 使⽤したモデルの説明 • 分析の流れ • 評価のポイント
  3. 4 1-1:マーケティングミックスモデリング(MMM)とは ‧ マーケティング‧ミックス‧モデリング(MMM)とは :    いろんな広告やキャンペーンが売上にどれくらい効いているかを、データを使って公平に 計算する⽅法。 広告やプロモーションの「費⽤対効果」を⾒える化して、次の投資を賢くするためのツール   (企業の家計簿ツールみたいなもの。⽬的が貯蓄でなく、収益最⼤化) ‧ なぜMMMが必要なのか? 理由 説明

    たとえ どの施策が効いているか分からない 複数の広告‧施策が同時に⾛ると、売上増 加の要因が⾒えにくい 家計簿で「どの出費が⼀番効いてる?」を 考えるイメージ デジタル計測の限界 Cookie規制やプライバシー強化で、個⼈ ベースの広告効果測定が難しくなっている レシートに「誰が買ったか」情報がなくて も、全体の⽀出は把握できるイメージ 経営判断の根拠が必要 「テレビに増額?Webに集中?」といった 投資判断を数字で裏付ける 家族会議で「教育費と住宅費どちらを優先 する?」を数字で説明するイメージ 予算配分の最適化 「追加予算をどこに投じればROIが最⼤化す るか」をシミュレーション可能 来⽉の⽣活費を「外⾷控える?光熱費抑え る?」と配分するイメージ
  4. 5 1-2:使⽤したモデルについて 項⽬ Robyn (Meta) Meridian (Google) LightweightMMM (Google AI

    / PyMC) 開発背景 ソーシャル広告のROI最適化 広告因果効果測定‧プライバシー対 応 Pythonでの軽量ベイジアンMMM ⼿法 アドストック+S字関数+進化的ア ルゴリズム 因果推論+地理的実験を前提 PyMCを利⽤したベイジアン推定 (GPU対応) 強み 実務で普及度No.1、導⼊事例多数 因果推論の厳密性が⾼い、広告主向 け ⾼速‧軽量で扱いやすく、Python ユーザーに⼈気 弱み 因果推論の厳密性はやや弱い ライブラリが新しく学習コスト⾼ 機能はRobynやMeridianより限定的 ユースケース 広告代理店‧ブランドのMMM実務 因果効果を重視する広告主 Pythonでプロトタイピング‧実験 よく使われる主要MMMライブラリとその⽐較 🎯 今回Meridianを選んだ理由 •データ特性:深圳市の実広告データを分析、因果推論で広告効果を正しく分離したい •⽬的:ROI最⼤化のため、媒体別寄与を厳密に推定して予算配分を最適化 •⽐較: • Robyn → 普及度⾼いが因果推論が弱い • LightweightMMM → 軽量だが機能限定 • Meridian → 因果推論と広告最適化の両⽴、今回の⽬的に最適 Github: https://github.com/jamesrawlins1000/Market-mix-modelling-data
  5. 7 1-4:MMMモデルの評価ポイント 評価観点 説明 主な指標 / チェックポイント 予測精度 モデルが実データをどの程度再現できるか MAPE,

    RMSE, R² レスポンスカーブ 投資額に対する効果の飽和関数が合理的か 限界ROI、曲線の形状 アドストック効果 広告効果の持続期間(減衰率)が妥当か 半減期(Half-life)、Decay parameter ROI / ROAS 各媒体ごとの投資回収率を測定 ROI(Return on Investment)、ROAS 投資効果シェア KPI増加に対して各媒体がどの程度寄与したか Incremental contribution (%) モデル⽐較 複数⼿法の整合性を検証 OLS / Bayesian / 正則化モデルの結果⽐較 最適化‧シミュレーション 予算配分の変更が成果に与える影響を評価 最適配分シナリオ、シミュレーション結果 ※補⾜:Meridianは シンプルに1つのモデルを安定して推定し、診断(収束確認‧精度評価‧チャネル寄与‧最適化)まで を出す という設計のため、スピードや安定性に⻑けている。(上記グレーを実施したい場合はRobynにて実施推奨) MMMの評価では、単にモデルの精度だけを⾒るのではなく、投資対効果や持続性、予算最適化まで幅広く チェックすることが重要です。以下を総合的に確認することで、モデルが信頼できるかどうか、さらに意思 決定に使える⽔準かを判断することができます。
  6. 8 ©2017-2025 kikagaku, Inc. All Rights Reserved. 8 2.分析データの詳細と課題 •

    分析データの概要 • データの中⾝ • 相関チェック • KPIの偏⾃⼰相関 • STL分解 • 予算配分分析 • 外れ値検出 • VIF
  7. 9 2-1.分析データと課題 中国深圳市のある家電メーカー(TV事業)の実広告データ(GitHub)を⽤いてMMMを実施。 https://github.com/jamesrawlins1000/Market-mix-modelling-data 本データは深圳市における実際の広告出稿データを匿名化したもの。深圳市における需要、売上、供給、POSデータ、広告費、モバイ ルSMS、新聞広告、ラジオ、テレビ、ポスター、インターネットなど、複数のチャネルで記録された様々なインプレッションに関する 情報が含まれており、GRP(グロス‧レイティング‧ポイント)の形式で広告キャンペーンの効果を算出。この時系列データセットに は2211の観測値と18の変数がある。 ※2010年1⽉〜2017年2⽉までの⽇別データ 現状:

    TV‧Internet‧Newspaper‧Radio‧SMS に予算を配分しているが、   投資効果の可視化が⼗分ではなく、判断が経験や慣習に依存している 具体的な課題: 各チャネルのROI(投資収益率)が把握できていない 投資対効果を無視した⼀律的な配分になりやすい 広告費の無駄が発⽣している可能性 •TCL:世界展開でトップクラスのシェアを 持つ深セン発のテレビメーカー •Skyworth(創維):中国国内で強い 存在感を持つ⼤⼿テレビブランド •Konka(康佳):⽼舗メーカーで歴史は ⻑いが現在はシェア縮⼩気味
  8. 10 2-2:中国深セン市ってどんなところ? •場所‧規模 中国広東省に位置し、⾹港と隣接する⼤都市。 ⼈⼝は約1,700万⼈を超える。 •経済特区の先駆け 1980年に中国初の経済特区として指定され、製 造業‧貿易‧テクノロジー産業の中⼼へと急成 ⻑。 •「中国のシリコンバレー」

    テンセント、ファーウェイ、DJIなどの世界的企 業の本社が集積。イノベーションとスタート アップ⽂化が根付く。 •購買⼒‧消費市場の厚み 若年層の多い都市で、デジタル広告‧Eコマース の消費意欲が⾼い。広告投資のROI検証には最適 な地域。
  9. 11 2-3.分析データの説明 DATE DEMAND Consumer Price Index (CPI) Consumer Confidence

    Index(CCI) Producer Price Index (PPI) Unit Price ($) POS/ Supply Data SALES ($) Adver tising Expen ses (SMS) Adver tising Expen ses(N ewspa per ads) Adver tising Expen ses(Ra dio) Adver tising Expen ses(TV ) Adver tising Expen ses(In ternet ) GRP (NewP aper ads) GRP(S MS) GRP(R adio GRP(I ntern et) GRP(T V) 2010/1/ 1 4,384 105 96 107 362 4,240 1,533,26 9 77 14 112 1,479 723 95 12 91 276 757 2010/1/ 2 4,366 105 96 107 362 4,266 1,542,67 1 73 13 106 1,370 718 115 28 112 291 860 2010/1/ 3 4,006 105 96 107 362 4,206 1,520,97 4 81 13 109 1,428 653 113 0 95 283 752 2010/1/ 4 4,076 105 96 107 362 4,176 1,510,12 5 66 13 93 1,309 622 72 0 99 306 749 2010/1/ 5 4,834 105 96 107 362 5,234 1,892,71 9 77 14 112 1,479 723 95 12 91 276 757 2010/1/ 6 4,636 105 96 107 362 4,446 1,607,76 3 73 13 106 1,370 718 115 28 112 291 860 2010/1/ 7 4,166 105 96 107 362 4,346 1,571,60 1 81 13 109 1,428 653 113 0 95 283 752 2010/1/ 8 4,186 105 96 107 362 4,216 1,524,59 0 66 13 93 1,309 622 72 0 99 306 749 2010/1/ 9 4,405 105 96 107 362 4,505 1,629,09 8 90 14 118 1,417 624 88 0 105 306 754 2010/1/ 10 5,561 105 96 107 362 5,661 2,047,13 1 69 13 92 1,334 612 38 0 108 306 777 分析データ(期間: 2010-01-03 〜 2017-02-26) 項⽬の説明 ⽬的変数 項⽬ 内容 意味するところ DATE ⽇付 データの観測⽇ 例: 2010/1/1 DEMAND 需要(販売数量) 売れた台数など、需要を表す指 標 Consumer Price Index (CPI) 消費者物価指数 物価⽔準の指標。消費者が感じ る物価動向を反映 Consumer Confidence Index (CCI) 消費者信頼感指数 消費者の購買意欲や景況感を⽰ す指標 Producer Price Index (PPI) ⽣産者物価指数 ⽣産者段階での物価動向。コス トインフレを反映 Unit Price ($) 単価 製品の平均販売単価 POS / Supply Data 流通データ ⼩売‧流通に出荷された数量な ど SALES ($) 売上⾼ 単価 × 販売数量の売上⾦額 Advertising Expenses (SMS) 広告費(SMS) SMS広告に使った費⽤ Advertising Expenses (Newspaper ads) 広告費(新聞) 新聞広告に使った費⽤ Advertising Expenses (Radio) 広告費(ラジオ) ラジオ広告に使った費⽤ Advertising Expenses (TV) 広告費(テレビ) テレビ広告に使った費⽤ Advertising Expenses (Internet) 広告費(インターネット) デジタル広告に使った費⽤ GRP (Newspaper ads) GRP(新聞) Gross Rating Point(視聴率×頻 度)。新聞での広告到達度 GRP (SMS) GRP(SMS) SMS広告の到達度 GRP (Radio) GRP(ラジオ) ラジオ広告の到達度 GRP (Internet) GRP(インターネット) ネット広告の到達度 GRP (TV) GRP(テレビ) テレビ広告の到達度
  10. 12 2-4.相関のチェック この相関⾏列を⾒ると、メディア費⽤系の変数同⼠(例:media_spend_sms と media_spend_radio や media_spend_newspaper)が強く相関しています。 Meridianにおける多重共線性への対応 🔹 リスク(相関が強すぎると…)

    • 変数同⼠が似た動きをしているため、どちらが効果を出しているか切り分けに くい • 係数が不安定になり、寄与度がブレやすい • ビジネス的な解釈を誤るリスク(例:SMSとRadio両⽅が⾼効果と出る) 🔹 Meridianでの対策(仕組み的に吸収) • リッジ回帰(L2正則化)   → 相関のある変数の係数を⾃動的に抑制し、安定化 • サチュレーション‧アドストック   → 飽和効果‧遅延効果を組み込むことで、単純な直線相関への依存を回避 • ベイズ的推定(ハイパーパラメータ制御)   → 過学習を抑え、効果を平均化 🔹 追加でできる⼯夫(実務向け) • チャネルをグループ化して解釈(例:SMS+Radioをモバイル系にまとめる) • 期間を変えて再学習 → 効果のブレを確認 • マーケティング知⾒と照合 → モデルだけに依存せず、実態と整合性を取る
  11. 13 2-5. KPI の偏⾃⼰相関(PACF: Partial Autocorrelation Function) ラグ <読み取りポイント> •ラグ0

    値は常に 1(⾃⼰相関)。ここは基準なので特に解釈不 要。 •ラグ1 が強く有意にプラス 直近の 1 期間前(Lag=1)の値が、現在の KPI に強く影響 している。 → 「KPI の⾃⼰回帰性が強い」=直前のデータにかなり 引っ張られる。 •ラグ2 〜 ラグ5 もやや有意 数週間先まで「惰性」のような影響が残っている。 KPI は短期的に滑らかな動きをする性質。 •それ以降(ラグ10以降)はほぼ0付近 ⻑期の⾃⼰相関はほとんどない。 KPI の予測には「直近数週間」が重要で、⻑期の過去デー タはほぼ影響しない。 KPI の動きは 短期依存型(直近1〜5週が影響) ⻑期的な影響は少ないので、 ARモデル(⾃⼰回帰モデル)を使う場 合は低次(AR(1)〜AR(5)くらい)が妥当 季節性はPACFでは顕著には出ていない(STL分解で確認した⽅が良 い)
  12. 14 2-6. STL分解(Seasonal-Trend decomposition using Loess) <読み取りポイント> 1.Original Series (KPI)

    1. 元の KPI の推移。 2. 2010〜2011 年前半は⼤きく変動、その後 2013〜 2015 年ごろに落ち着き、2016 年からまた上昇傾向。 2.Trend (⻑期トレンド) 1. ⻑期的には「2010〜2014 年にかけて減少      → 2015 以降は回復」している。 2. ⻑期景気や市場環境の影響が⽰唆される。 3.Seasonality (季節性, 52週周期 ≒ 年間) 1. 年単位での周期的な増減が存在。 2. 広告や消費の季節要因(年末商戦、旧正⽉など)を捉 えている可能性。 4.Residuals (残差) 1. トレンド‧季節性では説明できない変動部分。 2. ⼀部⼤きな外れ(2010 年前半や 2016 年前後)があ り、特定キャンペーンや外部ショックが影響した可能 性。
  13. 16 2-8.スパイク&キャンペーン痕跡 KPIの標準化と外れ値検出( ±3σ基準) <読み取りポイント> ✔ ⻘線はKPIを標準化した値(Zスコア)。 ✔ ⾚の破線が±3σの閾値。 ✔

    この範囲を超える点は、統計的に「外れ値の可能性が⾼い」と判断できる。 ✔ 図からは、⼤半の値は±3σの範囲内に収まっており、極端な外れ値は少ない。 ✔ したがって「データ全体の安定性は⽐較的⾼い」と解釈できる。 大きな外れ値は少なく、 安心してモデリングに使える
  14. 17 2-9.マルチコ‧VIF(相関とは別の視点) VIFの解釈ルール(⽬安) •VIF ≈ 1:多重共線性の⼼配はほぼない •VIF ≈ 1〜5:弱い〜中程度の共線性(通常は問題ない範囲) •VIF

    ≈ 5〜10:やや強い共線性(注意が必要) •VIF > 10:強い共線性(モデルの信頼性に影響する可能性⼤) <まとめ> •懸念は特にない:すべての変数が VIF < 5 に収まっており、多重共線性の問題は軽度。 •CPIとPPIの間にやや相関があるが、VIF 3程度ならモデル推定に⼤きな影響はない。 •CCIやPOSデータは安定して独⽴性が⾼い。 ✅ マルチコ(多重共線性) •説明変数同⼠が強く相関している状態  例:CPI(消費者物価指数)と    PPI(⽣産者物価指数)は似た動きをする •この状態になると「どの変数が本当に影響しているか」が 不明瞭になる ✅ VIF(分散膨張係数) •多重共線性の強さを数値化する指標 ある変数が、他の変数とどれくらい説明⼒を 共有しているかを測る 値が⼤きいほど共線性が強い <結果>
  15. 18 ©2017-2025 kikagaku, Inc. All Rights Reserved. 18 3.モデルの診断 •モデルが

    正しく収束 しているかを確認する •過学習を防⽌し、汎化性能を担保する •推定された パラメータの健全性をチェックする •予測精度や適合度 を検証する •問題点を把握し、改善のヒントを得る
  16. 19 3-1. R-hat Convergence Diagnostic(収束診断) ※ベイズ推定やMCMCサンプリングでモデルを作った後に、  ちゃんと収束しているかどうかを確認するために使う指標 読み取り⽅ • ⾚いライン

    = R-hat = 1.0(完全に収束している場合、理想値は1.0) • 各バー = パラメータごとのR-hat値 • 例えば alpha_m, beta_m, roi_m など。 ルール⽬安 • 1.0 〜 1.05くらい → 良好、収束している。 • 1.05 〜 1.1程度 → ほぼ問題ないが注意。 • 1.1 〜 1.2以上 → 収束していない可能性がある。 → サンプル数を増やす / モデル設定を⾒直す必要あり。 このグラフの結果 すべてのパラメータが ほぼ1.0に⾮常に近い(ズレても0.000数単位) したがって モデルは安定的に収束している と解釈して良い。 モデルは収束しており、パラメータ推定が 安定している。診断上は⼤きな問題なし
  17. 20 3-1-1.補⾜: パラメータについて パラメータ 説明 alpha_m メディアチャンネルごとの基礎的な効果の⼤きさ(インターセプトに近い役割)。広告費ゼロ時のベースライン効果。 beta_gm 広告⽀出に対する飽和効果(S字型の反応曲線)を制御するパラメータ。成⻑率や効率性の変化を表す。 beta_m

    メディアごとのレスポンス強度(広告⽀出が売上やKPIに与える係数)。投⼊に⽐例する直接的な効果。 ec_m "effective coefficient":各メディア効果の合成的な係数。広告費→最終的なKPI影響を⽰す。 gamma_c コントロール変数(例:CPI, PPI, 景気指標)の効果係数。外部要因がKPIに与える影響。 gamma_gc 季節性やグループ効果の調整係数。特定期間やカテゴリーでの外部要因寄与を補正する。 knot_values スプライン回帰に使う「区切り点」の値。⾮線形な効果(季節性や複雑な曲線効果)を表現するための節点。 mu_t 時間的トレンドの平均。⻑期的な基礎成⻑や低下を表す。 roi_m 各メディアのROI(投資収益率)。広告⽀出1単位あたりの効果を表す。MMMで最も意思決定に直結する指標のひとつ。 sigma 誤差項の分散(ノイズ)。モデルが説明できないランダムなばらつきを表す。 MMMの出⼒に出てくるパラメータ名は、軽量MMM (LightweightMMM)などベイジアン推定をベースに したライブラリ特有なものになります ポイント • alpha, beta 系 → メディア効果の強さや形状 • gamma 系 → コントロール要因の影響 • mu, knot → トレンドや季節性 • roi_m → 実務で最も注⽬する成果指標 • sigma → モデルの残差(予測できない部分の⼤きさ)
  18. 22 3-3.チャネル別ROI推定とモデル収束診断  <まとめ> • 各媒体ごとのROIをベイズ推定で算出 • 左図:ROI分布(効果の⼤きさと不確実性を確認) • 右図:MCMCチェーンの推移(収束状況を確認) •

    全体的に収束は安定、推定値の信頼性が⾼い • チャネル間のROI差が可視化され、投資判断に活⽤可能 •左側(密度プロット) 各チャネル(SMS, 新聞, ラジオ, TV, インターネット)の ROI 推定値の分布を表しています。ROI の「平均的な推定値」と 「不確実性の幅(ばらつき)」がわかります。分布が 0 付近 に偏っていれば「効果が⼩さい」、裾が広ければ「推定が不 安定」という解釈。 •右側(トレースプロット) MCMCサンプル(モデルの繰り返し推定)の推移。各⾊は チェーンを⽰し、横軸は反復回数、縦軸は ROI 値。複数 チェーンが同じように「帯状」に安定して分布していれば、 「収束している(モデルが安定的に学習できている)」と解 釈できます。逆に、ドリフトや⼤きな乖離があると「未収 束」の可能性。
  19. 25 ©2017-2025 kikagaku, Inc. All Rights Reserved. 25 4.結果 •

    Model fit (需要予測と広告効果の検証) • チャネル別貢献度とROIの⽰唆 • チャネル別の貢献度推移と順位変動
  20. 26 4-1.Model fit (需要予測と広告効果の検証) 本モデルは、広告費が需要に与える影響を分析し、将来の需要を予測するものです。 グラフの⻘い線がモデルによる予測値、オレンジ⾊の線が実際の需要を⽰しています。 ▪ ⾼いモデル精度 : 決定係数 (R-squared) が0.93と⾮常に⾼く、モデルがデータ変動の93%を説明できています。

    ▪ MAPE (平均絶対パーセント誤差) もわずか1%で、予測と実績が極めて近いことがわかります。 ▪ 予測と実績の適合性 : 予測値と実績値は全体的に近い動きをしており、需要の変動パターンを正確に捉えています。 ▪ 実績値が予測の90%信頼区間内にほぼ収まっており、予測の安定性を⽰しています。 • R-squared: モデルの適合度 • MAPE: 予測の誤差率 • wMAPE: 重み付けされた誤差率
  21. 29 ©2017-2025 kikagaku, Inc. All Rights Reserved. 29 5.予算の最適化 •

    最適化シナリオの効果確認 • 最適化によるチャネル別予算配分の変化 • 最適化による予算配分と効果 • 媒体別の最適⽀出と収益の関係 • 媒体別の最適⽀出と収益の関係
  22. 32 5-3.最適化による予算配分と効果 予算総額は 12Mで変化なし、ROIも 1.9を維持。インターネット68% (+1pt) に重点配分し、 TVは 28% (-1pt)

    に調整。インクリメンタル収益は +2K改善、わずかな配分変更でも効果を確認。 各チャネルの予算配分が最適化前後でどのように変化したか(%)
  23. 35 6-1. MMMモデル分析の振り返り 今回、新たなMMMライブラリであるGoogle Meridianの検証を通して、以下の知⾒を得ることができました。 • 技術的知⾒: 従来のツールと⽐較し、Meridianはベイズ推定による因果推論の透明性が⾼く、特にチャネル間の相乗 効果や飽和点の特定において解釈性の⾼いモデルが構築できました。⼀⽅で、事前分布の設定が結果に与 える影響が⼤きく、ドメイン知識に基づいた慎重なパラメータチューニングの重要性を再認識しました。

    • ビジネス適⽤への課題: 深圳の家電市場という特定のデータセットでは⼀定の⽰唆が得られたものの、⽇本市場や異なる商材へ適 ⽤する際には、市場構造の違いを考慮したモデルの再調整が必須となります。 • 今後のアクション: 今回のPoCで得た知⾒を基に、次は実務データ(⽇本市場)での適⽤検証を進めます。特に、KPIを「売 上」だけでなく「ブランドリフト」などの中間指標にも広げ、フルファネルでの最適化を⽬指すことで、 より精度の⾼いマーケティング投資判断に貢献したいと考えています。