Slide 1

Slide 1 text

MMMモデルを推定した。 で、結局どうやって予算最適化すればいいの? 2025-06 ディップ株式会社 データサイエンティスト(エキスパート) 呉 東文(ご とうぶん)

Slide 2

Slide 2 text

自己紹介 2

Slide 3

Slide 3 text

自 己 紹 介 バイトルの会社でデータサイエンスマネージャー をやっています 3 Qiitaで記事を書いています ので興味あったらぜひ Qiita @Gotoubun_taiwan

Slide 4

Slide 4 text

自 己 紹 介 副業(?)で政治学者 (計量政治学・国際政治理論) もやって います 4 計量・数理政治学会( JSQPS)2025年冬季集会 ポスター報告

Slide 5

Slide 5 text

自 己 紹 介 副業:政治学者 (計量政治学・国際政治理論) テーマ:国連の投票データの次元数の推定 5

Slide 6

Slide 6 text

チ | ム 紹 介 まだ世の中的に珍しいが、組織図上事業サイドに いるが、きちんとデータサイエンスしています 6 データサイエンス インパルス 応答関数 自動化 示唆 意思決定の 最適化 因果推論 テキスト 分析 状態空間 モデル 項目反応理論/ 協調フィルタリン グ 決定木系 モデル ビジネス インパクト 異動後感じた 一番大きな困難

Slide 7

Slide 7 text

論文と教科書に省略されがちな、 推定されたモデルを用いた最適化を話します 7 テ | マ 紹 介

Slide 8

Slide 8 text

政治学と経済学の教育で学ぶ紙と鉛筆で最適化する方法 は、応用研究では早い段階で壁にぶつかります 8 1 基礎モデルからの変形 が必要 教科書的なモデルに、 工場・店舗・支店別の固 定効果・季節性などを 入れる必要がある 2 解析的に求める時間が ない 応用研究ではスピード 感が求められる。数値 解で95点の精度が出る なら使うべき 3 解析的に求められない 場合によっては、解析 的に解を求めることが 数学的に不可能になる ケースもある 紙と 鉛 筆 の 問 題

Slide 9

Slide 9 text

でも、数値解析って、本当に信用していいの? 単純なモデルで検証してみよ 9 数 値 解 析 の 問 題 🤔

Slide 10

Slide 10 text

10 ロ | ド マッ プ モデル紹介 データ シミュレーション モデル推定 最適化 性能検証

Slide 11

Slide 11 text

11 モデル紹介

Slide 12

Slide 12 text

比較的シンプルかつ解析解が求められるモデルで、最適化 アルゴリズムのパフォーマンスを可視化します 12 モデ ル 紹 介 経済学でお馴染みのコブ =ダグラス型の生産関数 対数正規分布ノ イズ(iid) 右辺が左辺を超えたら経営会議で炎上する、、、 0と1の間 0と1の間

Slide 13

Slide 13 text

まずは解析的に、この最適化問題を紙と鉛筆 (LaTeX)で解きま す 13 条 件 付き 最 適 化 問 題 目的関数 予算制約式

Slide 14

Slide 14 text

ラグランジュ未定乗数法で解きます 14 条 件 なし 最 適 化 問 題

Slide 15

Slide 15 text

OOH広告とTVCMについて微分することで、広告出稿量・ 広告単価・係数の興味深い関係式が出てきます 15 ラグ ラン ジュ

Slide 16

Slide 16 text

最適広告出稿量は広告の効果と比例し、広告の単価と反比 例することがわかります 16 ラグ ラン ジュ

Slide 17

Slide 17 text

さらに、出稿金額比が係数比になることもわかります 17 ラグ ラン ジュ

Slide 18

Slide 18 text

次に、前のスライドの関係式を使って、予算制約式の TVCM を消去します 18 ラグ ラン ジュ

Slide 19

Slide 19 text

お待たせしました、これが解析解です! 19 解 析 解 係数比で予算配分の 比例が決まる 配分が決まった 上で、単価で出稿 量を決める

Slide 20

Slide 20 text

20 シミュレーションとモ デル推定

Slide 21

Slide 21 text

コブ=ダグラス型の生産関数にノイズが入るデータを生成 21 デ | タ生 成

Slide 22

Slide 22 text

`lm()`関数でも推定できるモデルですが、より複雑なモデルにも通用 する構成で説明するため、あえて Stanでベイズ推定します 22 ベイ ズモ デ ル

Slide 23

Slide 23 text

実際の業務と研究で行う分析は MCMCでやるとひ孫の代でも 終わらないレベルなので、高速な変分推論で! 23 モデ ルコ ンパ イル と推 定

Slide 24

Slide 24 text

これが現代のベイズモデルの重さです 💦変分推論を使っても 数時間かかります (8 CPUで並列処理設定済み) 24 変 分 推 論 でも 遅 い 3 次元数を推定するベイ ズword2vecモデル 8時間 (ハワイに行ける) 1 国連の投票データの次 元を推定するモデル 38分 2 テキストデータ因果推論 インド料理過程 4時間 (台湾に行ける)

Slide 25

Slide 25 text

25 最適化

Slide 26

Slide 26 text

最適化アルゴリズムは、目的関数と予算制約に対して様々な 数値の組み合わせを試行し、最適解を探索します 26 必 要 な 要 素

Slide 27

Slide 27 text

`model`ブロックがなく `generated quantities`単体のコード で、推定されたモデルの事後分布を自由自在に抽出できる 27 予 測 用 の S t a n コ | ド

Slide 28

Slide 28 text

予測の事後分布の中央値と出稿費用を出す関数をそれぞれ 用意する 28 予 測 用 の S t a n コ | ド

Slide 29

Slide 29 text

予算制約を 10から100まで変更し、最適化アルゴリズムがきち んと正しい最適出稿量を計算できるかを確認します 29 予 測 用 の S t a n コ | ド

Slide 30

Slide 30 text

概ね正解の黒い線に沿っていますが、 精度がいいとは言えないですね、、、、、、 30 最 適 化 の 結 果

Slide 31

Slide 31 text

どうしても正しい結果が知りたいなら、総当たりで計算すること をお勧めします 31 最 適 化 の 結 果

Slide 32

Slide 32 text

総当たり計算の結果に `dplyr`の処理をかけたら、 最適化が可能になります 32 最 適 化 の 結 果 ✅

Slide 33

Slide 33 text

33 Enjoy!