Slide 1

Slide 1 text

O2O広告のための
 データサイエンス
 CA BASE NEXT 2021
 
 早川 裕太


Slide 2

Slide 2 text

早川 裕太
 2019年度 新卒入社 AI事業本部 小売DXセクター データワン事業部 データサイエンティスト @qiringji @qiringji Hayakawa Yuta

Slide 3

Slide 3 text

広告
 メディア
 ゲーム


Slide 4

Slide 4 text

広告
 今日のトピック この辺りにまつわるデータサイエンスの話 
 メディア
 ゲーム


Slide 5

Slide 5 text

https://www.cyberagent.co.jp/news/detail/id=26012 https://www.cyberagent.co.jp/news/detail/id=25102 小売販促事業への参入


Slide 6

Slide 6 text

消費者と小売の接点をデジタル化・データ活用 小売販促事業への参入


Slide 7

Slide 7 text

TAKE HOME MESSAGE サイバーエージェントが小売DX領域に進出しているらしい 小売DX領域特有のデータサイエンス課題がありそう こんな解き方があるんだ・自分ならもっとうまく解けそう

Slide 8

Slide 8 text

小売販促デジタル化とデータサイエンス


Slide 9

Slide 9 text

計測 施策 (介入・最適化) 小売販促デジタル化とデータサイエンス
 大雑把データサイエンス

Slide 10

Slide 10 text

小売販促デジタル化とデータサイエンス
 計測 - デジタル広告の表示履歴 - 来店・店内行動のセンシング - POS・ID-POS - クーポン・アプリ利用の計測

Slide 11

Slide 11 text

施策 (介入・最適化) - デジタル広告・クーポン・アプリ・EC - 店内サイネージ・POP - 棚陳列・値付け - 商品開発 小売販促デジタル化とデータサイエンス


Slide 12

Slide 12 text

商習慣・プライバシーでデータ取得が難しい 施策が良かったかの計測ができない データ取得・計測ができてもバイアスが乗る おそらく待ち構えている計測の壁


Slide 13

Slide 13 text

そもそもデータがなければ始まらない データ取得バイアスが意図しない最適化を生むかも エビデンスに基づく施策立案・改善ができない 今日のメインは計測の話


Slide 14

Slide 14 text

計測の壁と解決策 O2O広告を題材に

Slide 15

Slide 15 text

O2O広告のためのデータイエンス
 Offline Online O2O:Online To Offline

Slide 16

Slide 16 text

O2O広告のためのデータイエンス
 - 決められた広告予算内で Web・アプリに広告を表示 - あらかじめ広告表示したい人を決め狙 い打つことも(ターゲティング) Online

Slide 17

Slide 17 text

Offline - 店舗での購入や来店を計測し 広告主に報告する O2O広告のためのデータイエンス


Slide 18

Slide 18 text

計測にまつわる2つの壁
 オンライン広告とオフライン成果の紐付け そもそもデータは取得できるのか?

Slide 19

Slide 19 text

計測にまつわる2つの壁
 オンライン広告とオフライン成果の紐付け そもそもデータは取得できるのか?

Slide 20

Slide 20 text

オンラインで完結 O2O広告 広告と成果の紐づけ商習慣
 代表的な商習慣: 広告クリック経由での 購買・インストールが成果 ?

Slide 21

Slide 21 text

CLICK! 広告クリックを経由したことが記録されている 流入経路がわかるオンライン


Slide 22

Slide 22 text

他メディアとの接触も多く広告と成果の紐付けは難しい 「クリック経由」はないオフライン


Slide 23

Slide 23 text

広告表示 グループ 広告非表示 グループ 紐付けない広告効果計測:A/Bテスト

Slide 24

Slide 24 text

広告表示 グループ 広告非表示 グループ 紐付けない広告効果計測:A/Bテスト ユーザーを 無作為に分割 インクリメンタルな 広告効果

Slide 25

Slide 25 text

A/Bテストの違和感 広告を当てたくても当てられない人がいる 広告表示 グループ 広告非表示 グループ ✅ ✅

Slide 26

Slide 26 text

A/Bテストの違和感 広告を当てたくても当てられない人がいる 効果を 過小評価してる? 広告表示 グループ 広告非表示 グループ ✅ ✅

Slide 27

Slide 27 text

薄まった分析 グループ間の比較で見えるのは 広告を当てようとすることの効果 A/Bテスト結果の分析は薄まった分析 治験の分野の用語から Intent to Treat (ITT)Analysisと呼ぶ 広告表示 グループ 広告非表示 グループ ✅ ✅

Slide 28

Slide 28 text

✅ ✅ - A/Bテスト的比較 ✅ ✅ ✅ ✅ ややこしい比較 →無作為抽出ではなくなる →広告表示されやすさに バイアスがある →薄まっている - 表示された人vsされなかった人で比較す ればいいじゃん

Slide 29

Slide 29 text

操作変数法 Ghost Ad 薄まらず偏らない分析

Slide 30

Slide 30 text

広告表示 広告表示群 アサイン 購買 他要因 操作変数法(IV)

Slide 31

Slide 31 text

→広告表示されやすさ、 購買しやすさは他要因と相関 →広告表示直接の効果と 区別できない 広告表示 購買 他要因 操作変数法(IV) - 広告表示は無作為ではない

Slide 32

Slide 32 text

広告表示群へのアサインは無作為で他要因と相関しない という性質を活かして広告表示の直接の効果を測る方法 広告表示 広告表示群 アサイン 購買 他要因 操作変数法(IV)

Slide 33

Slide 33 text

特に予算が限られていたある広告キャンペーン 広告表示群のうち4.7%が実際に広告視聴 操作変数法:プロダクトでの使用例 広告表示群 広告非表示群

Slide 34

Slide 34 text

操作変数法:プロダクトでの使用例 過度に薄まった効果に対して 期待されるインクリメンタルな購買を推定 広告表示を増やすことで より購買を伸ばす示唆

Slide 35

Slide 35 text

[1] Garrett et al., "Ghost ads: Improving the economics of measuring online ad effectiveness." Journal of Marketing Research 54.6 (2017): Ghost Ad [1] 広告表示 グループ 別広告表示 グループ ✅ ✅ ✅ ✅ - A/Bテストを工夫する - 関係のない別の広告を表示する - 広告にあたった人だけで比較

Slide 36

Slide 36 text

因果効果という意味でより正しい A/Bテスト+@の結果をどう使うか Merit ビジネス上の説明コストが比較的高い Demerit

Slide 37

Slide 37 text

A/Bテストと説明コスト 手法の説明コスト 薄まった分析の違和感(前述) 操作変数法等の因果推論的手法は説明がさらに大変 数字の与える印象 購買や購買率は0以上 A/Bテストの結果はマイナスになる場合がある

Slide 38

Slide 38 text

A/Bテストと説明コスト 広告主の理解が得られていない段階では、 A/Bテストの結果を提示することが競争上不利に働くかも知れない 科学的な正しさの担保と並行して 顧客理解を深めていくことが大事

Slide 39

Slide 39 text

ここまでのまとめ - オフラインの成果に貢献したオンライン広告を一意に決めるのは難しい - A/Bテストや派生する因果推論手法は広告効果を計測・検証する良い手段 - 一方でビジネス上の説明コストとのトレードオフは存在

Slide 40

Slide 40 text

計測にまつわる2つの壁 オンライン広告とオフライン成果の紐付け そもそもデータは取得できるのか?

Slide 41

Slide 41 text

IDの取得問題 IDがオフラインにしか存在しない プラスチック・紙のポイントカードなど プライバシー保護の観点で取得できない IDFA(広告識別子)規制

Slide 42

Slide 42 text

プライバシー問題は依然残る [2] Riederer et al. Linking Users Across Domains with Location Data: Theory and Validation, WWW2016. [3] Feng et al. DPLink: User Identity Linkage via Deep Neural Network From Heterogeneous Mobility Data, WWW2019. IDがオフラインにしか存在しない User Identity Linkage 問題として解く 複数ソースのIDを同定する問題 オフラインの計測を利用した多くの研究が存在 [2, 3]

Slide 43

Slide 43 text

- 店舗・地域の粒度でA/Bテストをおこなう - バイアスが残ること想定されるので因果推論手法で分析することが多い プライバシー保護の観点で取得できない チラシや店内サイネージなども同様に分析できそう

Slide 44

Slide 44 text

センサーデータ(GPS・WiFi・Bluetooth )で来店などを計測 端末種や設定で取得の頻度・質が変わってくる 計測のバイアス

Slide 45

Slide 45 text

特定小売のPOSで購買を計測 = 他の小売での購買は計測できない 計測のバイアス

Slide 46

Slide 46 text

- バイアスを認知した上で議論・分析 - 観測できている範囲で対応する 補正した推定量を考える (広告ログ×MLの例 [4] ) 制御する(同じようなバイアスを持った人同士を比較) [4] Zhang, Wenhao, et al. "Large-scale Causal Approaches to Debiasing Post-click Conversion Rate Estimation with Multi-task Learning." In Proc. of The Web Conference 2020. . 計測のバイアスと補正

Slide 47

Slide 47 text

ここまでのまとめ - オフラインにしか存在しないID・IDFA規制・計測のバイア ス・などの課題がある - こうしたデータサイエンス周辺の課題がデータサイエンス 課題になりそう

Slide 48

Slide 48 text

小売販促デジタル化と データサイエンス

Slide 49

Slide 49 text

計測 施策 (介入・最適化) 再掲:小売販促デジタル化とデータサイエンス
 大雑把データサイエンス

Slide 50

Slide 50 text

再掲:小売販促デジタル化とデータサイエンス
 計測 - デジタル広告の表示履歴 - 来店・店内行動のセンシング - POS・ID-POS - クーポン・アプリ利用の計測

Slide 51

Slide 51 text

施策 (介入・最適化) - デジタル広告・クーポン・アプリ・EC - 店内サイネージ・POP - 棚陳列・値付け - 商品開発 再掲:小売販促デジタル化とデータサイエンス


Slide 52

Slide 52 text

より事業・計測・施策の幅を広げることで 固有のデータサイエンス課題が現れるはず 小売販促デジタル化とデータサイエンス


Slide 53

Slide 53 text

We’re Hiring! 小売市場で新しいデータサイエンス課題を 発見・解決したい方を募集しています。 https://www.cyberagent.co.jp/careers/special/retaildxrecruit2021/

Slide 54

Slide 54 text

TAKE HOME MESSAGE サイバーエージェントが小売DX領域に進出しているらしい 小売DX領域特有のデータサイエンス課題がありそう こんな解き方があるんだ・自分ならもっとうまく解けそう

Slide 55

Slide 55 text

No content