広告クリエイティブと機械学習技術における現状と展望 / The Present and Future of Machine Learning for Ad Creatives

広告クリエイティブと機械学習技術における現状と展望 / The Present and Future of Machine Learning for Ad Creatives

この資料は2020年度人工知能学会第34回全国大会のオーガナイズドセッション「広告とAI」にて発表した際の資料です。

広告クリエイティブは主に画像やテキストなどから構成され、デジタル広告において購買対象となる顧客に対し、効果的に製品の情報を届ける重要な役割を担っている。こうしたクリエイティブは主に人手により、大量に作成および運用されている。しかし効果の高いクリエイティブを作るのは非常にコストがかかる。そのため、配信効果の高いクリエイティブの作成や運用のために、機械学習技術を用いた研究開発が世界中で盛んに行われている。特に広告クリエイティブを構成する素材の分析や、広告クリエイティブの配信効果を事前に予測するCTR予測・CVR予測、配信効果の高い広告クリエイティブの自動生成といったタスクが注目されている。本講演では、データマイニング分野で最難関国際会議であるKDD2019において発表した広告クリエイティブのCVR予測を元にした評価について紹介する。また最新の広告技術に関連する研究成果の紹介を行い、これまでの広告クリエイティブと機械学習技術における研究によって達成されている現状と今後の展望について議論する。

09ed5afcc83ed2abfea708651c975882?s=128

Shunsuke KITADA

June 09, 2020
Tweet

Transcript

  1. 2.

    自己紹介 2 北田 俊輔 (KITADA, Shunsuke) @shunk031 shunk031 法政大学大学院 理工学研究科

    D1 彌冨研 所属 • 深層学習を元にした基礎・応用研究 ◦ 自然言語処理: 文字形状に着目・解釈性のあるモデル ▪ YANS2019にて 奨励賞 を受賞 ◦ 医用画像処理: 悪性黒色腫自動診断システムの構築 ▪ IPSJ2019にて 学生奨励賞 受賞 ◦ 計算機広告: 広告クリエイティブの評価・作成支援 ▪ KDD2019(データマイニングの最難関国際会議)にて論文採択
  2. 4.

    KDD: Knowledge Discovery and Data mining 4 1. ACM SIGKDD

    International Conference on Knowledge Discovery and Data Mining Google Scholar の top publications データマイニングやデータ分析領域に おける最難関国際会議として位置付け KDD2019 in アラスカ, USA • 51カ国、3,150人が参加 • スポンサー費 総額 1.1億円 • 2つのtrackとその採択率 ◦ Research Track: 約14.8% ◦ Applied Data Science Track: 約20.7% https://www.kdd.org/kdd2019/sponsors 毎年 質の高い広告 x AIの研究成果が発表される
  3. 5.

    AdKDD | 広告技術に特化したワークショップ 5 招待講演や基調講演が豪華 • 世界トップ企業: Google, Microsoft, Criteo,

    Tencent, Yahoo Research, etc. ワークショップにスポンサー • 広告xAIに対して様々な企業が注目 • スポンサーのノベルティがもらえる 各社の最新事例が惜しみなく公開 • Tencent Ads: Interesting Problems and Unique Challenges (AdKDD19) 動画に自然な形で広告を合成する Tencent VideoIn Ads ◦ 物体認識や画像処理を高レベルで実現 ◦ 詳しい内容と解説 https://www.adkdd.org/2019-invited-talks
  4. 6.

    デジタル広告における広告クリエイティブ 6 • 主に画像やテキスト等から構成 ◦ 購買対象となる顧客に対し 効果的に製品の情報を届ける • 広告クリエイティブの作成や運用 ◦

    主に人手により大量に作成および運用 ◦ 効果の高い(≒ CTR や CVR が高い) 広告クリエイティブの作成は非常にコストがかかり困難 • 機械学習技術を中心とした研究開発 ◦ 世界中で盛んになってきている ▪ 広告xAIのみを扱うworkshop (AdKDD, CVPR Ads等) ▪ CTR や CVR の予測精度を競う kaggle competition ◦ 大規模なログデータを利用することで 配信効果の高いクリエイティブの作成や運用に期待
  5. 7.

    研究事例 | 機械学習技術と広告クリエイティブ 7 • 素材分析 [Azimi+ CIKM12] ◦ 配信効果の高い広告クリエイティブを視覚的な面で分析

    • 効果推定 [Chen+ ACMMM16; Lu+ ADKDD17] ◦ Click through rate (CTR)・Conversion rate (CVR) 推定 • 作成支援 [Kitada+ KDD19; Mishra+ RecSys19; Zhou+ WWW20] ◦ 配信効果の高いテキスト文の予測と可視化による作成支援 ◦ キーワード・キーフレーズ推薦による作成支援 • 自動生成 [Hughes+ KDD19] ◦ 検索連動型広告に対する配信効果の高い広告文の生成 • 運用支援 [Maehara+ IJCAI18; 北田+ JSAI20] ◦ 多腕バンディットによる配信枠決定支援 ◦ 効果の合わない広告クリエイティブの停止支援
  6. 9.

    配信効果の高い広告クリエイティブの分析 [Azimi+ CIKM12] 9 広告クリエイティブの見た目がユーザに与える影響を調査 • 見た目と配信効果の関係を定量的に分析 ◦ CTRを元にした割合予測、順位予測、 効果の高いものかどうかの分類予測

    • 43の視覚的特徴を人手により設計 ◦ 配色、輝度、コントラストの特徴 etc. • 実際のCTRへの影響度が最も高い特徴を発見 ◦ 配信された実世界のクリエイティブから 設計した特徴を抽出し予測に使用 ▪ コントラストが高い特徴が寄与 ◦ Saliencyマップの可視化により 対象クリエイティブにおいて 顕著な特徴がある部分を特定
  7. 10.

    深層学習を利用した広告のCTR予測 [Chen+ ACMMM16] 10 広告クリエイティブの画像も取り入れた深層学習モデル • 従来は人手による特徴量設計がメイン ◦ 広告に使われている画像から 高次の視覚的特徴を抽出するのは困難

    • 配信情報や広告画像を元にend2endで 学習可能な深層学習モデルを構築 ◦ 畳み込み層により画像から視覚的特徴を 学習し全結合層により配信情報の特徴を 学習したものを組み合わせる • 広告画像においてクリックの 予測に寄与する箇所を特定 ◦ Saliency mapによって 予測に寄与する部分を可視化
  8. 11.

    広告クリエイティブと 機械学習技術における 現状と展望 人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 11 配信効果の高いテキスト文の予測と可視化 [Kitada+

    KDD19] Conversion Prediction Using Multi-task Conditional Attention Networks to Support the Creation of Effective Ad Creatives. Shunsuke Kitada, Hitoshi Iyatomi (Hosei Univ.), Yoshifumi Seki (Gunosy Inc.). ADS, Poster#100
  9. 12.

    研究背景 | 作成支援に向けたクリエイティブの評価 12 • 配信効果の高いクリエイティブ作成支援は重要 ◦ コンバージョン(CV)が多い広告は一般的に効果が高い ◦ 既存や入稿されたものを正しく評価するのは非常に難しい

    • クリエイティブの良さを事前に推定 ◦ CV数が多くなるであろうクリエイティブを事前に推定 ◦ 良いクリエイティブ (e.g., テキスト文の内容) とは何か ➜ 効率的に作成可能で、作成支援や自動生成を目指せる テキストを対象とした 広告クリエイティブの評価 バナーは入れ替えることが 難しく固定の場合が多い テキストの入れ替えは 比較的容易であるため
  10. 13.

    研究背景 | 広告クリエイティブにおけるデータの性質 13 • コンバージョン数はクリック数と比べて非常に不均衡 ◦ 直接コンバージョンの性質を学習するのは困難を極める • コンバージョン数とクリック数には強い相関

    ◦ 共通した特徴の学習により困難な学習を打破できる可能性 クリック数とコンバージョン数の分布 クリック数とコンバージョン数の相関関係 クリック数とCV数 頻度 クリック数 CV数
  11. 14.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 14 1) 広告クリエイティブの効果を正確に評価する枠組みの提案 a) マルチタスク学習を用いた不均衡データに対する学習 CVとクリックを同時に学習させることで困難な学習に 対する予測精度の向上を期待

    b) Conditional attention機構の提案 予測精度向上と広告配信対象やクリエイティブの ジャンルといった属性値を考慮したattentionの決定 2) Attention可視化を用いた 広告クリエイティブの作成支援 Conditional attentionを用いた 重要単語の可視化に基づく クリエイティブ作成支援の検討
  12. 23.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 23 提案手法の評価 • 一般的な評価 ◦ Mean squared

    error (MSE) ▪ Ground truthとの誤差を計算する。小さいほど良い • 高CVのクリエイティブを正確に予測できているかを評価 ◦ Normalized discounted cumulative gain (NDCG) ▪ i 番目の順位に対する評価指標。大きいほど良い ▪ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) • 表示回数 (インプレッション) が極端に少ないものは除外 • MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化
  13. 24.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 24 提案手法の評価 • 一般的な評価 ◦ Mean squared

    error (MSE) ▪ Ground truthとの誤差を計算する。小さいほど良い • 高CVのクリエイティブを正確に予測できているかを評価 ◦ Normalized discounted cumulative gain (NDCG) ▪ i 番目の順位に対する評価指標。大きいほど良い ▪ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) • 表示回数 (インプレッション) が極端に少ないものは除外 • MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化
  14. 25.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 25 提案手法の評価 • 一般的な評価 ◦ Mean squared

    error (MSE) ▪ Ground truthとの誤差を計算する。小さいほど良い • 高CVのクリエイティブを正確に予測できているかを評価 ◦ Normalized discounted cumulative gain (NDCG) ▪ i 番目の順位に対する評価指標。大きいほど良い ▪ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) • 表示回数 (インプレッション) が極端に少ないものは除外 • MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化 Creative #1 CV数 小 Creative #2 Creative #... Creative #N CV数 大 予測CV数 大
  15. 26.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 26 提案手法の評価 • 一般的な評価 ◦ Mean squared

    error (MSE) ▪ Ground truthとの誤差を計算する。小さいほど良い • 高CVのクリエイティブを正確に予測できているかを評価 ◦ Normalized discounted cumulative gain (NDCG) ▪ i 番目の順位に対する評価指標。大きいほど良い ▪ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) • 表示回数 (インプレッション) が極端に少ないものは除外 • MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化 Creative #1 CV数 小 Creative #2 Creative #... Creative #N CV数 大 予測CV数 大 CVが多いクリエイティブを 正しく評価できる
  16. 27.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 27 提案手法の評価 • 一般的な評価 ◦ Mean squared

    error (MSE) ▪ Ground truthとの誤差を計算する。小さいほど良い • 高CVのクリエイティブを正確に予測できているかを評価 ◦ Normalized discounted cumulative gain (NDCG) ▪ i 番目の順位に対する評価指標。大きいほど良い ▪ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) • 表示回数 (インプレッション) が極端に少ないものは除外 • MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化
  17. 28.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 28 MSEを評価指標としたときの比較結果 • All: 評価対象のクリエイティブすべてに対して評価 • #CV>0:

    CV数0以上のクリエイティブに対して評価 すべてCV数を0と予測した場合においても比較的良い結果 → MSEのみで評価するのは難しい
  18. 29.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 29 NDCGを評価指標としたときの比較結果 • All: 評価対象のクリエイティブすべてに対して評価 • #CV

    top 1 %: CV数上位1%のクリエイティブに対して評価 CV数の多いクリエイティブに対する予測精度が 約4% 程度向上 ➜ 配信効果の高いクリエイティブを正確に予測することが可能
  19. 30.

    配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 30 Conditional attentionによる属性値を変化させた時の可視化 • 男性対象だと「男性」が発火している • 全体的な傾向として「〇〇監修」が発火しやすい

    ➜ 有名人の人名が強く、それに共起している場合が多い 配信対象に適した広告文の性質を直感的に捉えることが可能 可視化結果を元に広告文の作成や修正の支援を担える可能性
  20. 32.

    キーワード推薦による作成支援 [Mishra+ RecSys19; Zhou+ WWW20] 32 キーワード推薦 (単語単体) • 与えられたブランドに対して推薦

    • キーワードが関連しているかどうかを ランキングベースのDeepモデルで学習 キーフレーズ推薦 (複数の単語) • マルチモーダルを用いたTransformer ベースのモデル (LXMERT [Tan+ EMNLP19]) ◦ 広告画像・OCRによるテキスト・Wikipedia情報 • VQAの問題として分類とランキングの側面から定式化 ◦ 「なぜ買うべきか」 という質問に対する 回答が付与されている 公開データセットを 使用 [Hussain+ CVPR17]
  21. 33.

    広告クリエイティブの自動生成 [Hughes+ KDD19] 33 ランディングページ (LP) の情報を元に CTRが高い検索連動型広告のテキストを自動生成する • Bing

    Ads (Microsoft) LPから要約技術を元に広告文を生成 ◦ 事前学習としてcross entropyのみで要約タスクを学習 ◦ REINFORCE [Williams ML92] でCTRを最大化するよう学習 ▪ CTRを予測するoracle model [Ling+ WWW17] を使用 ◦ 600,000 のLPと広告のペアからモデルを学習 • 評価結果 ◦ 無料のサービスや具体的な数値がより多く含まれている (freeが含まれている) (広告の魅力を高めている [Thomaidou Ph.D thesis14] )
  22. 35.

    まとめと今後の展望 35 • 研究対象が広告配信アルゴリズムから 広告のワークフロー全体に広がっている ◦ 広告クリエイティブの作成・運用はその中心 ◦ ベンチマークとなるデータセットなどはないので 共通タスクになっていないが、重要性は認識されている

    • 世界トップ企業は学術的にも価値のある取り組みを遂行 ◦ 技術的に洗練されているため競争優位がある ▪ 世界トップ企業に遅れを取ってしまう可能性が高い ◦ 学術界からのキャッチアップだけでなく、 産業界からも新たな技術を生み出していくべき • より産学での連携が重要性を増す ◦ データが必要だが、公開は難しい領域 ◦ 企業内の研究力や共同研究での生産性アップが重要
  23. 36.

    参考文献 36 • [Williams ML92] Williams, Ronald J. "Simple statistical

    gradient-following algorithms for connectionist reinforcement learning." Machine learning 8.3-4 (1992): 229-256. • [Azimi+ CIKM12] Azimi et al. "Visual appearance of display ads and its effect on click through rate." Proc. of CIKM 2012. • [Thomaidou Ph.D thesis14] Thomaidou, Stamatina. Automated Creation and Optimization of Online Advertising Campaigns. Diss. Ph. D. thesis, Department of Informatics, Athens University of Economics and Business, 2014. • [Chen+ ACMMM16] Chen et al. "Deep ctr prediction in display advertising." Proc. of ACM MM 2016. • [Ling+ WWW17] Ling et al. "Model ensemble for click prediction in bing search ads." Proc. of WWW 2017. • [Lu+ ADKDD17] Lu et al. "A practical framework of conversion rate prediction for online display advertising." Proc. of ADKDD 2017. • [Hussain+ CVPR17] Hussain et al. "Automatic understanding of image and video advertisements." Proc. of CVPR 2017. • [Maehara+ IJCAI18] Maehara et al. "Optimal bidding strategy for brand advertising." Proc. of IJCAI 2018. • [Hughes+ KDD19] Hughes et al. “Generating Better Search Engine Text Advertisements with Deep Reinforcement Learning.” Proc. of KDD 2019.
  24. 37.

    参考文献 37 • [Kitada+ KDD19] Kitada et al. "Conversion Prediction

    Using Multi-task Conditional Attention Networks to Support the Creation of Effective Ad Creatives." Proc. of KDD 2019. • [Mishra+ RecSys19] Mishra et al. "Guiding creative design in online advertising." Proc. of RecSys 2019. • [Tan+ EMNLP19] Tan, Hao, and Mohit Bansal. "LXMERT: Learning Cross-Modality Encoder Representations from Transformers." Proc. of EMNLP-IJCNLP 2019. • [Zhou+ WWW20] Zhou et al. “Recommending Themes for Ad Creative Design via Visual-Linguistic Representations.” Proc. of WWW 2020.