広告クリエイティブと機械学習技術における現状と展望 / The Present and Future of Machine Learning for Ad Creatives

法政大学大学院理工学研究科応用情報工学専攻人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション広告とAI @熊本城ホール・熊本市民会館 2020/6/9 14:40
- 15:00 [講演URL] ※ 本講演で紹介する図や数式は対象の論文からキャプチャしました。

自己紹介 2 北田俊輔 (KITADA, Shunsuke) @shunk031 shunk031 法政大学大学院理工学研究科
D1 彌冨研所属 • 深層学習を元にした基礎・応用研究 ◦ 自然言語処理: 文字形状に着目・解釈性のあるモデル ▪ YANS2019にて奨励賞を受賞 ◦ 医用画像処理: 悪性黒色腫自動診断システムの構築 ▪ IPSJ2019にて学生奨励賞受賞 ◦ 計算機広告: 広告クリエイティブの評価・作成支援 ▪ KDD2019（データマイニングの最難関国際会議）にて論文採択

KDD2019にて論文採択された経緯 3 • Gunosyでのリサーチインターンシップの成果 ◦ データ分析アルバイトとして広告技術部（当時）に所属 ◦ 広告技術の経験を生かした「配信効果の高いクリエイティブ自動生成を目標とした周辺技術の研究」をテーマに設定 https://speakerdeck.com/ysekky/research-intern-case-study-at-gunosy
https://data.gunosy.io/entry/research-intern-kdd19

KDD: Knowledge Discovery and Data mining 4 1. ACM SIGKDD
International Conference on Knowledge Discovery and Data Mining Google Scholar の top publications データマイニングやデータ分析領域における最難関国際会議として位置付け KDD2019 in アラスカ, USA • 51カ国、3,150人が参加 • スポンサー費総額 1.1億円 • 2つのtrackとその採択率 ◦ Research Track: 約14.8% ◦ Applied Data Science Track: 約20.7% https://www.kdd.org/kdd2019/sponsors 毎年質の高い広告 x AIの研究成果が発表される

AdKDD | 広告技術に特化したワークショップ 5 招待講演や基調講演が豪華 • 世界トップ企業: Google, Microsoft, Criteo,
Tencent, Yahoo Research, etc. ワークショップにスポンサー • 広告xAIに対して様々な企業が注目 • スポンサーのノベルティがもらえる各社の最新事例が惜しみなく公開 • Tencent Ads: Interesting Problems and Unique Challenges (AdKDD19) 動画に自然な形で広告を合成する Tencent VideoIn Ads ◦ 物体認識や画像処理を高レベルで実現 ◦ 詳しい内容と解説 https://www.adkdd.org/2019-invited-talks

デジタル広告における広告クリエイティブ 6 • 主に画像やテキスト等から構成 ◦ 購買対象となる顧客に対し効果的に製品の情報を届ける • 広告クリエイティブの作成や運用 ◦
主に人手により大量に作成および運用 ◦ 効果の高い（≒ CTR や CVR が高い）広告クリエイティブの作成は非常にコストがかかり困難 • 機械学習技術を中心とした研究開発 ◦ 世界中で盛んになってきている ▪ 広告xAIのみを扱うworkshop (AdKDD, CVPR Ads等) ▪ CTR や CVR の予測精度を競う kaggle competition ◦ 大規模なログデータを利用することで配信効果の高いクリエイティブの作成や運用に期待

研究事例 | 機械学習技術と広告クリエイティブ 7 • 素材分析 [Azimi+ CIKM12] ◦ 配信効果の高い広告クリエイティブを視覚的な面で分析
• 効果推定 [Chen+ ACMMM16; Lu+ ADKDD17] ◦ Click through rate (CTR)・Conversion rate (CVR) 推定 • 作成支援 [Kitada+ KDD19; Mishra+ RecSys19; Zhou+ WWW20] ◦ 配信効果の高いテキスト文の予測と可視化による作成支援 ◦ キーワード・キーフレーズ推薦による作成支援 • 自動生成 [Hughes+ KDD19] ◦ 検索連動型広告に対する配信効果の高い広告文の生成 • 運用支援 [Maehara+ IJCAI18; 北田+ JSAI20] ◦ 多腕バンディットによる配信枠決定支援 ◦ 効果の合わない広告クリエイティブの停止支援

広告クリエイティブと機械学習技術における現状と展望人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 8 関連研究事例配信効果の高い広告クリエイティブの分析と予測

配信効果の高い広告クリエイティブの分析 [Azimi+ CIKM12] 9 広告クリエイティブの見た目がユーザに与える影響を調査 • 見た目と配信効果の関係を定量的に分析 ◦ CTRを元にした割合予測、順位予測、効果の高いものかどうかの分類予測
• 43の視覚的特徴を人手により設計 ◦ 配色、輝度、コントラストの特徴 etc. • 実際のCTRへの影響度が最も高い特徴を発見 ◦ 配信された実世界のクリエイティブから設計した特徴を抽出し予測に使用 ▪ コントラストが高い特徴が寄与 ◦ Saliencyマップの可視化により対象クリエイティブにおいて顕著な特徴がある部分を特定

深層学習を利用した広告のCTR予測 [Chen+ ACMMM16] 10 広告クリエイティブの画像も取り入れた深層学習モデル • 従来は人手による特徴量設計がメイン ◦ 広告に使われている画像から高次の視覚的特徴を抽出するのは困難
• 配信情報や広告画像を元にend2endで学習可能な深層学習モデルを構築 ◦ 畳み込み層により画像から視覚的特徴を学習し全結合層により配信情報の特徴を学習したものを組み合わせる • 広告画像においてクリックの予測に寄与する箇所を特定 ◦ Saliency mapによって予測に寄与する部分を可視化

広告クリエイティブと機械学習技術における現状と展望人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 11 配信効果の高いテキスト文の予測と可視化 [Kitada+
KDD19] Conversion Prediction Using Multi-task Conditional Attention Networks to Support the Creation of Eﬀective Ad Creatives. Shunsuke Kitada, Hitoshi Iyatomi (Hosei Univ.), Yoshifumi Seki (Gunosy Inc.). ADS, Poster#100

研究背景 | 作成支援に向けたクリエイティブの評価 12 • 配信効果の高いクリエイティブ作成支援は重要 ◦ コンバージョン（CV）が多い広告は一般的に効果が高い ◦ 既存や入稿されたものを正しく評価するのは非常に難しい
• クリエイティブの良さを事前に推定 ◦ CV数が多くなるであろうクリエイティブを事前に推定 ◦ 良いクリエイティブ (e.g., テキスト文の内容) とは何か ➜ 効率的に作成可能で、作成支援や自動生成を目指せるテキストを対象とした広告クリエイティブの評価バナーは入れ替えることが難しく固定の場合が多いテキストの入れ替えは比較的容易であるため

研究背景 | 広告クリエイティブにおけるデータの性質 13 • コンバージョン数はクリック数と比べて非常に不均衡 ◦ 直接コンバージョンの性質を学習するのは困難を極める • コンバージョン数とクリック数には強い相関
◦ 共通した特徴の学習により困難な学習を打破できる可能性クリック数とコンバージョン数の分布クリック数とコンバージョン数の相関関係クリック数とCV数頻度クリック数 CV数

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 14 1) 広告クリエイティブの効果を正確に評価する枠組みの提案 a) マルチタスク学習を用いた不均衡データに対する学習 CVとクリックを同時に学習させることで困難な学習に対する予測精度の向上を期待
b) Conditional attention機構の提案予測精度向上と広告配信対象やクリエイティブのジャンルといった属性値を考慮したattentionの決定 2) Attention可視化を用いた広告クリエイティブの作成支援 Conditional attentionを用いた重要単語の可視化に基づくクリエイティブ作成支援の検討

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 15

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 16 入力: クリエイティブのタイトル・説明文

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 17 出力 (マルチタスク学習): CV数・クリック数を同時に出力・学習

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 18 Attentionの可視化: CV数・クリック数を予測する際に寄与する単語

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 19 Attentionの可視化: CV数・クリック数を予測する際に寄与する単語特にCV数が高いデータに対してどのような言い回しが効果的か ➜
作成支援につながる可能性

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 20 Conditional attention: クリエイティブの属性値を考慮した動的なattention 配信対象（性別）や広告のジャンルにより変化する
提案手法

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 21 Conditional attentionで女性属性を付与した場合: “ダイエット”や”女子”に注目

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 22 Conditional attentionで男性属性を付与した場合: “具体的な数値”や”方法”に注目

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 23 提案手法の評価 • 一般的な評価 ◦ Mean squared
error (MSE) ▪ Ground truthとの誤差を計算する。小さいほど良い • 高CVのクリエイティブを正確に予測できているかを評価 ◦ Normalized discounted cumulative gain (NDCG) ▪ i 番目の順位に対する評価指標。大きいほど良い ▪ 上位の評価の結果が全体の評価結果に影響を与える評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) • 表示回数 (インプレッション) が極端に少ないものは除外 • MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、事前学習済みw2vで単語をベクトル化

error (MSE) ▪ Ground truthとの誤差を計算する。小さいほど良い • 高CVのクリエイティブを正確に予測できているかを評価 ◦ Normalized discounted cumulative gain (NDCG) ▪ i 番目の順位に対する評価指標。大きいほど良い ▪ 上位の評価の結果が全体の評価結果に影響を与える評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) • 表示回数 (インプレッション) が極端に少ないものは除外 • MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、事前学習済みw2vで単語をベクトル化 Creative #1 CV数小 Creative #2 Creative #... Creative #N CV数大予測CV数大

error (MSE) ▪ Ground truthとの誤差を計算する。小さいほど良い • 高CVのクリエイティブを正確に予測できているかを評価 ◦ Normalized discounted cumulative gain (NDCG) ▪ i 番目の順位に対する評価指標。大きいほど良い ▪ 上位の評価の結果が全体の評価結果に影響を与える評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) • 表示回数 (インプレッション) が極端に少ないものは除外 • MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、事前学習済みw2vで単語をベクトル化 Creative #1 CV数小 Creative #2 Creative #... Creative #N CV数大予測CV数大 CVが多いクリエイティブを正しく評価できる

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 28 MSEを評価指標としたときの比較結果 • All: 評価対象のクリエイティブすべてに対して評価 • #CV>0:
CV数0以上のクリエイティブに対して評価すべてCV数を0と予測した場合においても比較的良い結果 → MSEのみで評価するのは難しい

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 29 NDCGを評価指標としたときの比較結果 • All: 評価対象のクリエイティブすべてに対して評価 • #CV
top 1 %: CV数上位1%のクリエイティブに対して評価 CV数の多いクリエイティブに対する予測精度が約4％程度向上 ➜ 配信効果の高いクリエイティブを正確に予測することが可能

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 30 Conditional attentionによる属性値を変化させた時の可視化 • 男性対象だと「男性」が発火している • 全体的な傾向として「〇〇監修」が発火しやすい
➜ 有名人の人名が強く、それに共起している場合が多い配信対象に適した広告文の性質を直感的に捉えることが可能可視化結果を元に広告文の作成や修正の支援を担える可能性

広告クリエイティブと機械学習技術における現状と展望人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 31 関連研究事例広告クリエイティブの作成支援と自動生成

キーワード推薦による作成支援 [Mishra+ RecSys19; Zhou+ WWW20] 32 キーワード推薦 (単語単体) • 与えられたブランドに対して推薦
• キーワードが関連しているかどうかをランキングベースのDeepモデルで学習キーフレーズ推薦 (複数の単語) • マルチモーダルを用いたTransformer ベースのモデル (LXMERT [Tan+ EMNLP19]) ◦ 広告画像・OCRによるテキスト・Wikipedia情報 • VQAの問題として分類とランキングの側面から定式化 ◦ 「なぜ買うべきか」という質問に対する回答が付与されている公開データセットを使用 [Hussain+ CVPR17]

広告クリエイティブの自動生成 [Hughes+ KDD19] 33 ランディングページ (LP) の情報を元に CTRが高い検索連動型広告のテキストを自動生成する • Bing
Ads (Microsoft) LPから要約技術を元に広告文を生成 ◦ 事前学習としてcross entropyのみで要約タスクを学習 ◦ REINFORCE [Williams ML92] でCTRを最大化するよう学習 ▪ CTRを予測するoracle model [Ling+ WWW17] を使用 ◦ 600,000 のLPと広告のペアからモデルを学習 • 評価結果 ◦ 無料のサービスや具体的な数値がより多く含まれている (freeが含まれている) (広告の魅力を高めている [Thomaidou Ph.D thesis14] )

広告クリエイティブと機械学習技術における現状と展望人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 34 広告クリエイティブと機械学習技術におけるまとめと今後の展望

まとめと今後の展望 35 • 研究対象が広告配信アルゴリズムから広告のワークフロー全体に広がっている ◦ 広告クリエイティブの作成・運用はその中心 ◦ ベンチマークとなるデータセットなどはないので共通タスクになっていないが、重要性は認識されている
• 世界トップ企業は学術的にも価値のある取り組みを遂行 ◦ 技術的に洗練されているため競争優位がある ▪ 世界トップ企業に遅れを取ってしまう可能性が高い ◦ 学術界からのキャッチアップだけでなく、産業界からも新たな技術を生み出していくべき • より産学での連携が重要性を増す ◦ データが必要だが、公開は難しい領域 ◦ 企業内の研究力や共同研究での生産性アップが重要

参考文献 36 • [Williams ML92] Williams, Ronald J. "Simple statistical
gradient-following algorithms for connectionist reinforcement learning." Machine learning 8.3-4 (1992): 229-256. • [Azimi+ CIKM12] Azimi et al. "Visual appearance of display ads and its eﬀect on click through rate." Proc. of CIKM 2012. • [Thomaidou Ph.D thesis14] Thomaidou, Stamatina. Automated Creation and Optimization of Online Advertising Campaigns. Diss. Ph. D. thesis, Department of Informatics, Athens University of Economics and Business, 2014. • [Chen+ ACMMM16] Chen et al. "Deep ctr prediction in display advertising." Proc. of ACM MM 2016. • [Ling+ WWW17] Ling et al. "Model ensemble for click prediction in bing search ads." Proc. of WWW 2017. • [Lu+ ADKDD17] Lu et al. "A practical framework of conversion rate prediction for online display advertising." Proc. of ADKDD 2017. • [Hussain+ CVPR17] Hussain et al. "Automatic understanding of image and video advertisements." Proc. of CVPR 2017. • [Maehara+ IJCAI18] Maehara et al. "Optimal bidding strategy for brand advertising." Proc. of IJCAI 2018. • [Hughes+ KDD19] Hughes et al. “Generating Better Search Engine Text Advertisements with Deep Reinforcement Learning.” Proc. of KDD 2019.

参考文献 37 • [Kitada+ KDD19] Kitada et al. "Conversion Prediction
Using Multi-task Conditional Attention Networks to Support the Creation of Eﬀective Ad Creatives." Proc. of KDD 2019. • [Mishra+ RecSys19] Mishra et al. "Guiding creative design in online advertising." Proc. of RecSys 2019. • [Tan+ EMNLP19] Tan, Hao, and Mohit Bansal. "LXMERT: Learning Cross-Modality Encoder Representations from Transformers." Proc. of EMNLP-IJCNLP 2019. • [Zhou+ WWW20] Zhou et al. “Recommending Themes for Ad Creative Design via Visual-Linguistic Representations.” Proc. of WWW 2020.

広告クリエイティブと機械学習技術における現状と展望 / The Present and Fut...

広告クリエイティブと機械学習技術における現状と展望 / The Present and Future of Machine Learning for Ad Creatives

Shunsuke KITADA

More Decks by Shunsuke KITADA

Other Decks in Research

Featured

Transcript

法政大学大学院理工学研究科応用情報工学専攻人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション広告とAI @熊本城ホール・熊本市民会館 2020/6/9 14:40

自己紹介 2 北田俊輔 (KITADA, Shunsuke) @shunk031 shunk031 法政大学大学院理工学研究科

KDD: Knowledge Discovery and Data mining 4 1. ACM SIGKDD

AdKDD | 広告技術に特化したワークショップ 5 招待講演や基調講演が豪華 • 世界トップ企業: Google, Microsoft, Criteo,

デジタル広告における広告クリエイティブ 6 • 主に画像やテキスト等から構成 ◦ 購買対象となる顧客に対し効果的に製品の情報を届ける • 広告クリエイティブの作成や運用 ◦

研究事例 | 機械学習技術と広告クリエイティブ 7 • 素材分析 [Azimi+ CIKM12] ◦ 配信効果の高い広告クリエイティブを視覚的な面で分析

広告クリエイティブと機械学習技術における現状と展望人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 8 関連研究事例配信効果の高い広告クリエイティブの分析と予測

深層学習を利用した広告のCTR予測 [Chen+ ACMMM16] 10 広告クリエイティブの画像も取り入れた深層学習モデル • 従来は人手による特徴量設計がメイン ◦ 広告に使われている画像から高次の視覚的特徴を抽出するのは困難

広告クリエイティブと機械学習技術における現状と展望人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 11 配信効果の高いテキスト文の予測と可視化 [Kitada+

研究背景 | 広告クリエイティブにおけるデータの性質 13 • コンバージョン数はクリック数と比べて非常に不均衡 ◦ 直接コンバージョンの性質を学習するのは困難を極める • コンバージョン数とクリック数には強い相関

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 15

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 16 入力: クリエイティブのタイトル・説明文

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 17 出力 (マルチタスク学習): CV数・クリック数を同時に出力・学習

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 18 Attentionの可視化: CV数・クリック数を予測する際に寄与する単語

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 19 Attentionの可視化: CV数・クリック数を予測する際に寄与する単語特にCV数が高いデータに対してどのような言い回しが効果的か ➜

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 20 Conditional attention: クリエイティブの属性値を考慮した動的なattention 配信対象（性別）や広告のジャンルにより変化する

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 21 Conditional attentionで女性属性を付与した場合: “ダイエット”や”女子”に注目

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 22 Conditional attentionで男性属性を付与した場合: “具体的な数値”や”方法”に注目

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 23 提案手法の評価 • 一般的な評価 ◦ Mean squared

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 24 提案手法の評価 • 一般的な評価 ◦ Mean squared

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 25 提案手法の評価 • 一般的な評価 ◦ Mean squared

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 26 提案手法の評価 • 一般的な評価 ◦ Mean squared

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 27 提案手法の評価 • 一般的な評価 ◦ Mean squared

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 28 MSEを評価指標としたときの比較結果 • All: 評価対象のクリエイティブすべてに対して評価 • #CV>0:

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 29 NDCGを評価指標としたときの比較結果 • All: 評価対象のクリエイティブすべてに対して評価 • #CV

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 30 Conditional attentionによる属性値を変化させた時の可視化 • 男性対象だと「男性」が発火している • 全体的な傾向として「〇〇監修」が発火しやすい

広告クリエイティブと機械学習技術における現状と展望人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 31 関連研究事例広告クリエイティブの作成支援と自動生成

キーワード推薦による作成支援 [Mishra+ RecSys19; Zhou+ WWW20] 32 キーワード推薦 (単語単体) • 与えられたブランドに対して推薦

広告クリエイティブの自動生成 [Hughes+ KDD19] 33 ランディングページ (LP) の情報を元に CTRが高い検索連動型広告のテキストを自動生成する • Bing

広告クリエイティブと機械学習技術における現状と展望人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 34 広告クリエイティブと機械学習技術におけるまとめと今後の展望

参考文献 36 • [Williams ML92] Williams, Ronald J. "Simple statistical

参考文献 37 • [Kitada+ KDD19] Kitada et al. "Conversion Prediction