$30 off During Our Annual Pro Sale. View Details »

広告とAI(とハイパーパラメータ最適化) / Ad with AI

Masahiro Nomura
July 23, 2018
1.3k

広告とAI(とハイパーパラメータ最適化) / Ad with AI

Masahiro Nomura

July 23, 2018
Tweet

Transcript

  1. 広告とAI (とハイパーパラメータ最適化) 野村 将寛 (AI Lab) 2018/07/19(木) @慶應義塾大学

  2. 自己紹介: ▪ 名前: 野村 将寛(のむら まさひろ) ▪ 経歴: 2017・4 〜

    ◦ Black-box関数最適化を研究(修士) ▪ 入社後: ◦ アドテクスタジオ所属 ◦ 【AMoAd】 データエンジニアリング ◦ 【AI Lab】 ハイパーパラメータ最適化
  3. Outline: ▪ RTB(Real Time Bidding) ▪ アドテクで行われている研究を一部紹介 ◦ 深層学習によるFacebook広告のCTR予測[岩崎 18]

    ◦ 「土地勘」は学習できるのか[宗政 18] ◦ CycleGANを用いた感情スタイル転送[大田 18] ▪ ハイパーパラメータ最適化
  4. RTB (Real Time Bidding): Publisher 広告を表示して たくさん収益欲しい! Advertiser ギターを売るために 広告効果を最大化したい!

    Publisher, Advertiserの願いを RTBにより実現する
  5. RTB (Real Time Bidding): 広告枠

  6. RTB (Real Time Bidding): 広告枠 Ad Call

  7. RTB (Real Time Bidding): 広告枠 SSP Ad Call Publisherの利益を最大化する (Supply

    Side Platform)
  8. RTB (Real Time Bidding): 広告枠 SSP Ad Call Bid Request

    メディアID:〜 ユーザID:〜 Publisherの利益を最大化する (Supply Side Platform)
  9. RTB (Real Time Bidding): 広告枠 SSP DSP DSP DSP DSP

    Ad Call Bid Request メディアID:〜 ユーザID:〜 Publisherの利益を最大化する (Supply Side Platform) Advertiserの利益を最大化する (Demand Side Platform)
  10. RTB (Real Time Bidding): 広告枠 SSP DSP DSP DSP DSP

    Ad Call Publisherの利益を最大化する (Supply Side Platform) Advertiserの利益を最大化する (Demand Side Platform) ¥300 ¥200 ¥100 ¥50
  11. RTB (Real Time Bidding): 広告枠 SSP DSP DSP DSP DSP

    Ad Call Publisherの利益を最大化する (Supply Side Platform) Advertiserの利益を最大化する (Demand Side Platform) ¥300 ¥200 ¥100 ¥50 ¥200で落札
  12. RTB (Real Time Bidding): 広告枠 SSP DSP DSP DSP DSP

    Ad Call Publisherの利益を最大化する (Supply Side Platform) Advertiserの利益を最大化する (Demand Side Platform) ¥300 ¥200 ¥100 ¥50 ¥200で落札
  13. どの位の確率で広告がclickされるのか?: 〜 CTR, CVR推定について 〜 ▪ DSPは何をもとに入札額を決めればいいか? ▪ 「この金額でconversionを獲得したい」という指標(CPA)を持っている ▪

    そこから1回表示あたりの価値(eCPM)を計算してみる 広告枠 O. Chapelle, Modeling delayed feedback in display advertising, KDD(2014)
  14. どの位の確率で広告がclickされるのか?: 〜 CTR, CVR推定について 〜 ▪ DSPは何をもとに入札額を決めればいいか? ▪ 「この金額でconversionを獲得したい」という指標(CPA)を持っている ▪

    そこから1回表示あたりの価値(eCPM)を計算してみる クリック率(CTR) コンバージョン率(CVR) 広告枠 O. Chapelle, Modeling delayed feedback in display advertising, KDD(2014)
  15. 深層学習によるFacebook広告のCTR予測[岩崎 18]: 基本的なfeature (ユーザ属性など) Facebook広告の例) 画像 テキスト これらを組み合わせて CTR推定できないか? 岩崎,

    深層学習によるFacebook広告のCTR予測, 人工知能学会(2018)
  16. 深層学習によるFacebook広告のCTR予測[岩崎 18]: Deep Neural Network Batch-Normalization Fully-connected layer Fully-connected layer

    384 256 1 CTR ConvNet 197×197 128 ConvNet 128 Fully-connected layer 128 daily_budget, bid_amount, reach_estimate, age, gender, location, interests,,, etc 0 0 1 0 ······ 1 0 0 1 それぞれをDeep Learningで学習 - 基本的なfeature (ユーザ属性など) - 画像 - テキスト 岩崎, 深層学習によるFacebook広告のCTR予測, 人工知能学会(2018) Validation Loss
  17. image net CTR post like comment

  18. None
  19. 「土地勘」は学習できるのか[宗政 18]: 特定の趣味・嗜好を持つユーザに配信したい オフライン上の行動履歴からユーザのデモグラを推定できると嬉しい 釣りが好きだから 海沿いをよく歩いてるよ テーマパーク好きだから 遊園地によく行くよ 宗政, 深見,

    森脇,「土地勘」は学習できるのか -機械学習によるエリアラベリング, 人工知能学会(2018)
  20. 「土地勘」は学習できるのか[宗政 18]: ただ,行動が即座に判断できる場所は多くない その場所の「土地勘」がある人物なら判別できるのでは? ロジスティック回帰,SVM,XGBoostを用いて「飲屋街」かどうか判定 宗政, 深見, 森脇,「土地勘」は学習できるのか -機械学習によるエリアラベリング, 人工知能学会(2018)

    駅からの距離 敷地面積 収入 地価公示 階数 女性_宿泊・飲食サービ ス業 女性_分類不能 スイーツ系 店舗 女性_製造業 男性_製造業
  21. CycleGANを用いた感情スタイル転送[大田 18]: 画像データから感情表現を抽出できれば,バナー広告のデザイン元の素材 に対して感情を付与できる バナー広告の制作現場に対する支援ができるのでは 大田,CycleGANを用いた感情スタイル転送,人工知能学会(2018) ‘happy’, ‘scary’ 間でCycleGANにより変換を学習

  22. 大田,CycleGANを用いた感情スタイル転送,人工知能学会(2018)

  23. ハイパーパラメータ最適化: ハイパーパラメータ: 学習の前に設定されるパラメータ 学習により更新されるパラメータとは区別される e.g) Deep Learning - 学習率 (

    + 最適化手法固 有のパラメータ) - Dropout率 - 層数 - 各層のユニットサイズ - 活性化関数の種類 (ReLu, Tanh, Sigmoidな ど) - バッチサイズ e.g) XGBoost - 学習率 - 木の本数 - 木の深さ - サブサンプル率 - 正則化係数 - 分割の閾値の重み e.g) SVM - カーネルの種類(RBF, Polynominal, Sigmoidな ど) - カーネルのbandwidth - 正則化係数 ハイパーパラメータの例)
  24. ハイパーパラメータ最適化問題は Black-box関数最適化問題 と見なせる 実はそういう問題は身の回りにある Black-box関数最適化問題 ? - 目的関数の数式がわからない - つまり微分もできない関数

    - 目的関数値のみが利用可能
  25. Googleによるクッキー作成 Googleではおいしいクッキーを作る問題を Black-box関数最適化問題として解いている - baking soda - brown sugar -

    white sugar - butter - vanilla - egg - flour - chocolate 社員に食べてもらい,Feedbackから改善 - chip type - salt - cayenne - orange extract - baking time - baking temperature D. Golovin, B. Solnik, S. Moitra, G. Kochanski, J. Karro, D. Sculley, Google Vizier: A Service for Black-Box Optimization, KDD(2017)
  26. これからやりたいこと: • CA内のチューニング課題を一手に引き受けたい! ◦ チューニングのような面倒な作業は後回しにしがち ◦ でもそれによって発生してる機会損失が必ずあるはず ◦ モデル化からサポートできれば理想 •

    広告という枠組みを超えて貢献していきたい. ◦ Black-box関数はゲームなどでもよく現れる(気がする) • 世界一の最適化アルゴリズムを開発する ◦ 論文と一緒にOSSも流行らせたい
  27. Appendix

  28. AI Labとは: アドテクスタジオにある 広告やマーケティングに特化した研究組織

  29. None
  30. 対話エージェントによる接客対話技 術の研究 - チャットボット - ロボット 自動応答や感情抑制,情報推薦  などの技術開発に挑戦 対話エージェント 自動対話技術

  31. 広告市場の拡大に伴って,バナー や動画などの広告クリエイティブの 制作コスト増大が課題 - デザイナーの制作支援 - 機械学習を用いたクリエイティ ブの自動生成技術 広告クリエイティブの制作支援と自 動生成

  32. 広告のどの要因が効果に結びつく のか分析 より因果効果が高いであろう場所や タイミング,ユーザに対してターゲ ティングを行う 広告の因果効果の分析

  33. AI Lab: 産学連携

  34. RTB (Real Time Bidding): セカンドプライスオークション ▪ 2位のDSPの入札額が落札額として用いられるオークション ▪ なぜこんなことをするのか? ←

    買う側は自身の思う適切な金額を入札することが最 適な戦略となっている(耐戦略性を満たす) ▪ e.g) 「200円なら広告出したい!」という場合,200円で入札することが最適な戦略とな る
  35. どの位の確率で広告がclickされるのか?: 〜 CTR, CVR推定について 〜 ▪ Q. 「クリックされるかどうかの判定って簡単じゃないの?」 ▪ A.

    簡単じゃないよ! ◦ データ量が膨大: 月間数千億リクエストをさばくプロダクトもあります ◦ スパース性: 広告ID, メディアID, ユーザIDなどのfeatureはユニーク数が非常に 多い ◦ imbalanced data: click, conversionされる数は,されない数に比べて非常に少な い ◦ モデル更新: 古いモデルのままでは新規広告に対応できない
  36. ハイパーパラメータ最適化: Grid search 探索範囲をグリッドに分けて探索を行う

  37. ハイパーパラメータ最適化: Grid search 探索範囲をグリッドに分けて探索を行う

  38. ハイパーパラメータ最適化: Grid search 探索範囲をグリッドに分けて探索を行う 0.1 5.1 2.8 4.4 1.4 7.2

    2.3 0.7 2.7
  39. ハイパーパラメータ最適化: Random search 範囲内でランダムに探索を行う J. Bergstra, and Y. Bengio, Random

    search for hyper-parameter optimization, The Journal of Machine Learning Research, 13:281–305, (2012)
  40. ハイパーパラメータ最適化: ベイズ最適化 https://adtech.cyberagent.io/research/archives/24