$30 off During Our Annual Pro Sale. View Details »

広告クリエイティブと機械学習技術における現状と展望 / The Present and Future of Machine Learning for Ad Creatives

広告クリエイティブと機械学習技術における現状と展望 / The Present and Future of Machine Learning for Ad Creatives

この資料は2020年度人工知能学会第34回全国大会のオーガナイズドセッション「広告とAI」にて発表した際の資料です。

広告クリエイティブは主に画像やテキストなどから構成され、デジタル広告において購買対象となる顧客に対し、効果的に製品の情報を届ける重要な役割を担っている。こうしたクリエイティブは主に人手により、大量に作成および運用されている。しかし効果の高いクリエイティブを作るのは非常にコストがかかる。そのため、配信効果の高いクリエイティブの作成や運用のために、機械学習技術を用いた研究開発が世界中で盛んに行われている。特に広告クリエイティブを構成する素材の分析や、広告クリエイティブの配信効果を事前に予測するCTR予測・CVR予測、配信効果の高い広告クリエイティブの自動生成といったタスクが注目されている。本講演では、データマイニング分野で最難関国際会議であるKDD2019において発表した広告クリエイティブのCVR予測を元にした評価について紹介する。また最新の広告技術に関連する研究成果の紹介を行い、これまでの広告クリエイティブと機械学習技術における研究によって達成されている現状と今後の展望について議論する。

Shunsuke KITADA

June 09, 2020
Tweet

More Decks by Shunsuke KITADA

Other Decks in Research

Transcript

  1. 法政大学大学院 理工学研究科 応用情報工学専攻
    人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション 広告とAI
    @熊本城ホール・熊本市民会館 2020/6/9 14:40 - 15:00 [講演URL]
    ※ 本講演で紹介する図や数式は対象の論文からキャプチャしました。

    View Slide

  2. 自己紹介
    2
    北田 俊輔 (KITADA, Shunsuke)
    @shunk031 shunk031
    法政大学大学院 理工学研究科 D1 彌冨研 所属
    ● 深層学習を元にした基礎・応用研究
    ○ 自然言語処理: 文字形状に着目・解釈性のあるモデル
    ■ YANS2019にて 奨励賞 を受賞
    ○ 医用画像処理: 悪性黒色腫自動診断システムの構築
    ■ IPSJ2019にて 学生奨励賞 受賞
    ○ 計算機広告: 広告クリエイティブの評価・作成支援
    ■ KDD2019(データマイニングの最難関国際会議)にて論文採択

    View Slide

  3. KDD2019にて論文採択された経緯
    3
    ● Gunosyでのリサーチインターンシップの成果
    ○ データ分析アルバイトとして広告技術部(当時)に所属
    ○ 広告技術の経験を生かした「配信効果の高いクリエイティブ
    自動生成を目標とした周辺技術の研究」をテーマに設定
    https://speakerdeck.com/ysekky/research-intern-case-study-at-gunosy
    https://data.gunosy.io/entry/research-intern-kdd19

    View Slide

  4. KDD: Knowledge Discovery and Data mining
    4
    1. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
    Google Scholar の top publications
    データマイニングやデータ分析領域に
    おける最難関国際会議として位置付け
    KDD2019 in アラスカ, USA
    ● 51カ国、3,150人が参加
    ● スポンサー費 総額 1.1億円
    ● 2つのtrackとその採択率
    ○ Research Track: 約14.8%
    ○ Applied Data Science Track: 約20.7%
    https://www.kdd.org/kdd2019/sponsors
    毎年 質の高い広告 x AIの研究成果が発表される

    View Slide

  5. AdKDD | 広告技術に特化したワークショップ
    5
    招待講演や基調講演が豪華
    ● 世界トップ企業: Google, Microsoft,
    Criteo, Tencent, Yahoo Research, etc.
    ワークショップにスポンサー
    ● 広告xAIに対して様々な企業が注目
    ● スポンサーのノベルティがもらえる
    各社の最新事例が惜しみなく公開
    ● Tencent Ads: Interesting Problems
    and Unique Challenges (AdKDD19)
    動画に自然な形で広告を合成する
    Tencent VideoIn Ads
    ○ 物体認識や画像処理を高レベルで実現
    ○ 詳しい内容と解説
    https://www.adkdd.org/2019-invited-talks

    View Slide

  6. デジタル広告における広告クリエイティブ
    6
    ● 主に画像やテキスト等から構成
    ○ 購買対象となる顧客に対し
    効果的に製品の情報を届ける
    ● 広告クリエイティブの作成や運用
    ○ 主に人手により大量に作成および運用
    ○ 効果の高い(≒ CTR や CVR が高い)
    広告クリエイティブの作成は非常にコストがかかり困難
    ● 機械学習技術を中心とした研究開発
    ○ 世界中で盛んになってきている
    ■ 広告xAIのみを扱うworkshop (AdKDD, CVPR Ads等)
    ■ CTR や CVR の予測精度を競う kaggle competition
    ○ 大規模なログデータを利用することで
    配信効果の高いクリエイティブの作成や運用に期待

    View Slide

  7. 研究事例 | 機械学習技術と広告クリエイティブ
    7
    ● 素材分析 [Azimi+ CIKM12]
    ○ 配信効果の高い広告クリエイティブを視覚的な面で分析
    ● 効果推定 [Chen+ ACMMM16; Lu+ ADKDD17]
    ○ Click through rate (CTR)・Conversion rate (CVR) 推定
    ● 作成支援 [Kitada+ KDD19; Mishra+ RecSys19; Zhou+ WWW20]
    ○ 配信効果の高いテキスト文の予測と可視化による作成支援
    ○ キーワード・キーフレーズ推薦による作成支援
    ● 自動生成 [Hughes+ KDD19]
    ○ 検索連動型広告に対する配信効果の高い広告文の生成
    ● 運用支援 [Maehara+ IJCAI18; 北田+ JSAI20]
    ○ 多腕バンディットによる配信枠決定支援
    ○ 効果の合わない広告クリエイティブの停止支援

    View Slide

  8. 広告クリエイティブと
    機械学習技術における
    現状と展望
    人工知能学会第34回全国大会 (JSAI2020)
    オーガナイズドセッション “広告とAI”
    8
    関連研究事例
    配信効果の高い広告クリエイティブの分析と予測

    View Slide

  9. 配信効果の高い広告クリエイティブの分析 [Azimi+ CIKM12]
    9
    広告クリエイティブの見た目がユーザに与える影響を調査
    ● 見た目と配信効果の関係を定量的に分析
    ○ CTRを元にした割合予測、順位予測、
    効果の高いものかどうかの分類予測
    ● 43の視覚的特徴を人手により設計
    ○ 配色、輝度、コントラストの特徴 etc.
    ● 実際のCTRへの影響度が最も高い特徴を発見
    ○ 配信された実世界のクリエイティブから
    設計した特徴を抽出し予測に使用
    ■ コントラストが高い特徴が寄与
    ○ Saliencyマップの可視化により
    対象クリエイティブにおいて
    顕著な特徴がある部分を特定

    View Slide

  10. 深層学習を利用した広告のCTR予測 [Chen+ ACMMM16]
    10
    広告クリエイティブの画像も取り入れた深層学習モデル
    ● 従来は人手による特徴量設計がメイン
    ○ 広告に使われている画像から
    高次の視覚的特徴を抽出するのは困難
    ● 配信情報や広告画像を元にend2endで
    学習可能な深層学習モデルを構築
    ○ 畳み込み層により画像から視覚的特徴を
    学習し全結合層により配信情報の特徴を
    学習したものを組み合わせる
    ● 広告画像においてクリックの
    予測に寄与する箇所を特定
    ○ Saliency mapによって
    予測に寄与する部分を可視化

    View Slide

  11. 広告クリエイティブと
    機械学習技術における
    現状と展望
    人工知能学会第34回全国大会 (JSAI2020)
    オーガナイズドセッション “広告とAI”
    11
    配信効果の高いテキスト文の予測と可視化
    [Kitada+ KDD19]
    Conversion Prediction Using Multi-task Conditional Attention Networks
    to Support the Creation of Effective Ad Creatives.
    Shunsuke Kitada, Hitoshi Iyatomi (Hosei Univ.),
    Yoshifumi Seki (Gunosy Inc.). ADS, Poster#100

    View Slide

  12. 研究背景 | 作成支援に向けたクリエイティブの評価
    12
    ● 配信効果の高いクリエイティブ作成支援は重要
    ○ コンバージョン(CV)が多い広告は一般的に効果が高い
    ○ 既存や入稿されたものを正しく評価するのは非常に難しい
    ● クリエイティブの良さを事前に推定
    ○ CV数が多くなるであろうクリエイティブを事前に推定
    ○ 良いクリエイティブ (e.g., テキスト文の内容) とは何か
    ➜ 効率的に作成可能で、作成支援や自動生成を目指せる
    テキストを対象とした
    広告クリエイティブの評価
    バナーは入れ替えることが
    難しく固定の場合が多い
    テキストの入れ替えは
    比較的容易であるため

    View Slide

  13. 研究背景 | 広告クリエイティブにおけるデータの性質
    13
    ● コンバージョン数はクリック数と比べて非常に不均衡
    ○ 直接コンバージョンの性質を学習するのは困難を極める
    ● コンバージョン数とクリック数には強い相関
    ○ 共通した特徴の学習により困難な学習を打破できる可能性
    クリック数とコンバージョン数の分布 クリック数とコンバージョン数の相関関係
    クリック数とCV数
    頻度
    クリック数
    CV数

    View Slide

  14. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    14
    1) 広告クリエイティブの効果を正確に評価する枠組みの提案
    a) マルチタスク学習を用いた不均衡データに対する学習
    CVとクリックを同時に学習させることで困難な学習に
    対する予測精度の向上を期待
    b) Conditional attention機構の提案
    予測精度向上と広告配信対象やクリエイティブの
    ジャンルといった属性値を考慮したattentionの決定
    2) Attention可視化を用いた
    広告クリエイティブの作成支援
    Conditional attentionを用いた
    重要単語の可視化に基づく
    クリエイティブ作成支援の検討

    View Slide

  15. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    15

    View Slide

  16. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    16
    入力:
    クリエイティブの
    タイトル・説明文

    View Slide

  17. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    17
    出力 (マルチタスク学習):
    CV数・クリック数を
    同時に出力・学習

    View Slide

  18. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    18
    Attentionの可視化:
    CV数・クリック数を
    予測する際に寄与する単語

    View Slide

  19. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    19
    Attentionの可視化:
    CV数・クリック数を
    予測する際に寄与する単語 特にCV数が高いデータに対して
    どのような言い回しが効果的か
    ➜ 作成支援につながる 可能性

    View Slide

  20. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    20
    Conditional attention:
    クリエイティブの属性値を
    考慮した動的なattention
    配信対象(性別)や広告の
    ジャンルにより変化する
    提案手法

    View Slide

  21. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    21
    Conditional attentionで
    女性属性を付与した場合:
    “ダイエット”や”女子”に注目

    View Slide

  22. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    22
    Conditional attentionで
    男性属性を付与した場合:
    “具体的な数値”や”方法”に注目

    View Slide

  23. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    23
    提案手法の評価
    ● 一般的な評価
    ○ Mean squared error (MSE)
    ■ Ground truthとの誤差を計算する。小さいほど良い
    ● 高CVのクリエイティブを正確に予測できているかを評価
    ○ Normalized discounted cumulative gain (NDCG)
    ■ i 番目の順位に対する評価指標。大きいほど良い
    ■ 上位の評価の結果が全体の評価結果に影響を与える
    評価用データセット
    Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8)
    ● 表示回数 (インプレッション) が極端に少ないものは除外
    ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、
    事前学習済みw2vで単語をベクトル化

    View Slide

  24. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    24
    提案手法の評価
    ● 一般的な評価
    ○ Mean squared error (MSE)
    ■ Ground truthとの誤差を計算する。小さいほど良い
    ● 高CVのクリエイティブを正確に予測できているかを評価
    ○ Normalized discounted cumulative gain (NDCG)
    ■ i 番目の順位に対する評価指標。大きいほど良い
    ■ 上位の評価の結果が全体の評価結果に影響を与える
    評価用データセット
    Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8)
    ● 表示回数 (インプレッション) が極端に少ないものは除外
    ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、
    事前学習済みw2vで単語をベクトル化

    View Slide

  25. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    25
    提案手法の評価
    ● 一般的な評価
    ○ Mean squared error (MSE)
    ■ Ground truthとの誤差を計算する。小さいほど良い
    ● 高CVのクリエイティブを正確に予測できているかを評価
    ○ Normalized discounted cumulative gain (NDCG)
    ■ i 番目の順位に対する評価指標。大きいほど良い
    ■ 上位の評価の結果が全体の評価結果に影響を与える
    評価用データセット
    Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8)
    ● 表示回数 (インプレッション) が極端に少ないものは除外
    ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、
    事前学習済みw2vで単語をベクトル化
    Creative
    #1
    CV数 小
    Creative
    #2
    Creative
    #...
    Creative
    #N
    CV数 大
    予測CV数 大

    View Slide

  26. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    26
    提案手法の評価
    ● 一般的な評価
    ○ Mean squared error (MSE)
    ■ Ground truthとの誤差を計算する。小さいほど良い
    ● 高CVのクリエイティブを正確に予測できているかを評価
    ○ Normalized discounted cumulative gain (NDCG)
    ■ i 番目の順位に対する評価指標。大きいほど良い
    ■ 上位の評価の結果が全体の評価結果に影響を与える
    評価用データセット
    Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8)
    ● 表示回数 (インプレッション) が極端に少ないものは除外
    ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、
    事前学習済みw2vで単語をベクトル化
    Creative
    #1
    CV数 小
    Creative
    #2
    Creative
    #...
    Creative
    #N
    CV数 大
    予測CV数 大
    CVが多いクリエイティブを
    正しく評価できる

    View Slide

  27. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    27
    提案手法の評価
    ● 一般的な評価
    ○ Mean squared error (MSE)
    ■ Ground truthとの誤差を計算する。小さいほど良い
    ● 高CVのクリエイティブを正確に予測できているかを評価
    ○ Normalized discounted cumulative gain (NDCG)
    ■ i 番目の順位に対する評価指標。大きいほど良い
    ■ 上位の評価の結果が全体の評価結果に影響を与える
    評価用データセット
    Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8)
    ● 表示回数 (インプレッション) が極端に少ないものは除外
    ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、
    事前学習済みw2vで単語をベクトル化

    View Slide

  28. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    28
    MSEを評価指標としたときの比較結果
    ● All: 評価対象のクリエイティブすべてに対して評価
    ● #CV>0: CV数0以上のクリエイティブに対して評価
    すべてCV数を0と予測した場合においても比較的良い結果
    → MSEのみで評価するのは難しい

    View Slide

  29. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    29
    NDCGを評価指標としたときの比較結果
    ● All: 評価対象のクリエイティブすべてに対して評価
    ● #CV top 1 %: CV数上位1%のクリエイティブに対して評価
    CV数の多いクリエイティブに対する予測精度が 約4% 程度向上
    ➜ 配信効果の高いクリエイティブを正確に予測することが可能

    View Slide

  30. 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19]
    30
    Conditional attentionによる属性値を変化させた時の可視化
    ● 男性対象だと「男性」が発火している
    ● 全体的な傾向として「〇〇監修」が発火しやすい
    ➜ 有名人の人名が強く、それに共起している場合が多い
    配信対象に適した広告文の性質を直感的に捉えることが可能
    可視化結果を元に広告文の作成や修正の支援を担える可能性

    View Slide

  31. 広告クリエイティブと
    機械学習技術における
    現状と展望
    人工知能学会第34回全国大会 (JSAI2020)
    オーガナイズドセッション “広告とAI”
    31
    関連研究事例
    広告クリエイティブの作成支援と自動生成

    View Slide

  32. キーワード推薦による作成支援 [Mishra+ RecSys19; Zhou+ WWW20]
    32
    キーワード推薦 (単語単体)
    ● 与えられたブランドに対して推薦
    ● キーワードが関連しているかどうかを
    ランキングベースのDeepモデルで学習
    キーフレーズ推薦 (複数の単語)
    ● マルチモーダルを用いたTransformer
    ベースのモデル (LXMERT [Tan+ EMNLP19])
    ○ 広告画像・OCRによるテキスト・Wikipedia情報
    ● VQAの問題として分類とランキングの側面から定式化
    ○ 「なぜ買うべきか」
    という質問に対する
    回答が付与されている
    公開データセットを
    使用 [Hussain+ CVPR17]

    View Slide

  33. 広告クリエイティブの自動生成 [Hughes+ KDD19]
    33
    ランディングページ (LP) の情報を元に
    CTRが高い検索連動型広告のテキストを自動生成する
    ● Bing Ads (Microsoft)
    LPから要約技術を元に広告文を生成
    ○ 事前学習としてcross entropyのみで要約タスクを学習
    ○ REINFORCE [Williams ML92] でCTRを最大化するよう学習
    ■ CTRを予測するoracle model [Ling+ WWW17] を使用
    ○ 600,000 のLPと広告のペアからモデルを学習
    ● 評価結果
    ○ 無料のサービスや具体的な数値がより多く含まれている
    (freeが含まれている) (広告の魅力を高めている [Thomaidou Ph.D thesis14] )

    View Slide

  34. 広告クリエイティブと
    機械学習技術における
    現状と展望
    人工知能学会第34回全国大会 (JSAI2020)
    オーガナイズドセッション “広告とAI”
    34
    広告クリエイティブと機械学習技術における
    まとめと今後の展望

    View Slide

  35. まとめと今後の展望
    35
    ● 研究対象が広告配信アルゴリズムから
    広告のワークフロー全体に広がっている
    ○ 広告クリエイティブの作成・運用はその中心
    ○ ベンチマークとなるデータセットなどはないので
    共通タスクになっていないが、重要性は認識されている
    ● 世界トップ企業は学術的にも価値のある取り組みを遂行
    ○ 技術的に洗練されているため競争優位がある
    ■ 世界トップ企業に遅れを取ってしまう可能性が高い
    ○ 学術界からのキャッチアップだけでなく、
    産業界からも新たな技術を生み出していくべき
    ● より産学での連携が重要性を増す
    ○ データが必要だが、公開は難しい領域
    ○ 企業内の研究力や共同研究での生産性アップが重要

    View Slide

  36. 参考文献
    36
    ● [Williams ML92] Williams, Ronald J. "Simple statistical gradient-following algorithms
    for connectionist reinforcement learning." Machine learning 8.3-4 (1992): 229-256.
    ● [Azimi+ CIKM12] Azimi et al. "Visual appearance of display ads and its effect on click
    through rate." Proc. of CIKM 2012.
    ● [Thomaidou Ph.D thesis14] Thomaidou, Stamatina. Automated Creation and
    Optimization of Online Advertising Campaigns. Diss. Ph. D. thesis, Department of
    Informatics, Athens University of Economics and Business, 2014.
    ● [Chen+ ACMMM16] Chen et al. "Deep ctr prediction in display advertising." Proc. of
    ACM MM 2016.
    ● [Ling+ WWW17] Ling et al. "Model ensemble for click prediction in bing search ads."
    Proc. of WWW 2017.
    ● [Lu+ ADKDD17] Lu et al. "A practical framework of conversion rate prediction for
    online display advertising." Proc. of ADKDD 2017.
    ● [Hussain+ CVPR17] Hussain et al. "Automatic understanding of image and video
    advertisements." Proc. of CVPR 2017.
    ● [Maehara+ IJCAI18] Maehara et al. "Optimal bidding strategy for brand advertising."
    Proc. of IJCAI 2018.
    ● [Hughes+ KDD19] Hughes et al. “Generating Better Search Engine Text
    Advertisements with Deep Reinforcement Learning.” Proc. of KDD 2019.

    View Slide

  37. 参考文献
    37
    ● [Kitada+ KDD19] Kitada et al. "Conversion Prediction Using Multi-task Conditional
    Attention Networks to Support the Creation of Effective Ad Creatives." Proc. of KDD
    2019.
    ● [Mishra+ RecSys19] Mishra et al. "Guiding creative design in online advertising." Proc.
    of RecSys 2019.
    ● [Tan+ EMNLP19] Tan, Hao, and Mohit Bansal. "LXMERT: Learning Cross-Modality
    Encoder Representations from Transformers." Proc. of EMNLP-IJCNLP 2019.
    ● [Zhou+ WWW20] Zhou et al. “Recommending Themes for Ad Creative Design via
    Visual-Linguistic Representations.” Proc. of WWW 2020.

    View Slide