Slide 1

Slide 1 text

法政大学大学院 理工学研究科 応用情報工学専攻 人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション 広告とAI @熊本城ホール・熊本市民会館 2020/6/9 14:40 - 15:00 [講演URL] ※ 本講演で紹介する図や数式は対象の論文からキャプチャしました。

Slide 2

Slide 2 text

自己紹介 2 北田 俊輔 (KITADA, Shunsuke) @shunk031 shunk031 法政大学大学院 理工学研究科 D1 彌冨研 所属 ● 深層学習を元にした基礎・応用研究 ○ 自然言語処理: 文字形状に着目・解釈性のあるモデル ■ YANS2019にて 奨励賞 を受賞 ○ 医用画像処理: 悪性黒色腫自動診断システムの構築 ■ IPSJ2019にて 学生奨励賞 受賞 ○ 計算機広告: 広告クリエイティブの評価・作成支援 ■ KDD2019(データマイニングの最難関国際会議)にて論文採択

Slide 3

Slide 3 text

KDD2019にて論文採択された経緯 3 ● Gunosyでのリサーチインターンシップの成果 ○ データ分析アルバイトとして広告技術部(当時)に所属 ○ 広告技術の経験を生かした「配信効果の高いクリエイティブ 自動生成を目標とした周辺技術の研究」をテーマに設定 https://speakerdeck.com/ysekky/research-intern-case-study-at-gunosy https://data.gunosy.io/entry/research-intern-kdd19

Slide 4

Slide 4 text

KDD: Knowledge Discovery and Data mining 4 1. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Google Scholar の top publications データマイニングやデータ分析領域に おける最難関国際会議として位置付け KDD2019 in アラスカ, USA ● 51カ国、3,150人が参加 ● スポンサー費 総額 1.1億円 ● 2つのtrackとその採択率 ○ Research Track: 約14.8% ○ Applied Data Science Track: 約20.7% https://www.kdd.org/kdd2019/sponsors 毎年 質の高い広告 x AIの研究成果が発表される

Slide 5

Slide 5 text

AdKDD | 広告技術に特化したワークショップ 5 招待講演や基調講演が豪華 ● 世界トップ企業: Google, Microsoft, Criteo, Tencent, Yahoo Research, etc. ワークショップにスポンサー ● 広告xAIに対して様々な企業が注目 ● スポンサーのノベルティがもらえる 各社の最新事例が惜しみなく公開 ● Tencent Ads: Interesting Problems and Unique Challenges (AdKDD19) 動画に自然な形で広告を合成する Tencent VideoIn Ads ○ 物体認識や画像処理を高レベルで実現 ○ 詳しい内容と解説 https://www.adkdd.org/2019-invited-talks

Slide 6

Slide 6 text

デジタル広告における広告クリエイティブ 6 ● 主に画像やテキスト等から構成 ○ 購買対象となる顧客に対し 効果的に製品の情報を届ける ● 広告クリエイティブの作成や運用 ○ 主に人手により大量に作成および運用 ○ 効果の高い(≒ CTR や CVR が高い) 広告クリエイティブの作成は非常にコストがかかり困難 ● 機械学習技術を中心とした研究開発 ○ 世界中で盛んになってきている ■ 広告xAIのみを扱うworkshop (AdKDD, CVPR Ads等) ■ CTR や CVR の予測精度を競う kaggle competition ○ 大規模なログデータを利用することで 配信効果の高いクリエイティブの作成や運用に期待

Slide 7

Slide 7 text

研究事例 | 機械学習技術と広告クリエイティブ 7 ● 素材分析 [Azimi+ CIKM12] ○ 配信効果の高い広告クリエイティブを視覚的な面で分析 ● 効果推定 [Chen+ ACMMM16; Lu+ ADKDD17] ○ Click through rate (CTR)・Conversion rate (CVR) 推定 ● 作成支援 [Kitada+ KDD19; Mishra+ RecSys19; Zhou+ WWW20] ○ 配信効果の高いテキスト文の予測と可視化による作成支援 ○ キーワード・キーフレーズ推薦による作成支援 ● 自動生成 [Hughes+ KDD19] ○ 検索連動型広告に対する配信効果の高い広告文の生成 ● 運用支援 [Maehara+ IJCAI18; 北田+ JSAI20] ○ 多腕バンディットによる配信枠決定支援 ○ 効果の合わない広告クリエイティブの停止支援

Slide 8

Slide 8 text

広告クリエイティブと 機械学習技術における 現状と展望 人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 8 関連研究事例 配信効果の高い広告クリエイティブの分析と予測

Slide 9

Slide 9 text

配信効果の高い広告クリエイティブの分析 [Azimi+ CIKM12] 9 広告クリエイティブの見た目がユーザに与える影響を調査 ● 見た目と配信効果の関係を定量的に分析 ○ CTRを元にした割合予測、順位予測、 効果の高いものかどうかの分類予測 ● 43の視覚的特徴を人手により設計 ○ 配色、輝度、コントラストの特徴 etc. ● 実際のCTRへの影響度が最も高い特徴を発見 ○ 配信された実世界のクリエイティブから 設計した特徴を抽出し予測に使用 ■ コントラストが高い特徴が寄与 ○ Saliencyマップの可視化により 対象クリエイティブにおいて 顕著な特徴がある部分を特定

Slide 10

Slide 10 text

深層学習を利用した広告のCTR予測 [Chen+ ACMMM16] 10 広告クリエイティブの画像も取り入れた深層学習モデル ● 従来は人手による特徴量設計がメイン ○ 広告に使われている画像から 高次の視覚的特徴を抽出するのは困難 ● 配信情報や広告画像を元にend2endで 学習可能な深層学習モデルを構築 ○ 畳み込み層により画像から視覚的特徴を 学習し全結合層により配信情報の特徴を 学習したものを組み合わせる ● 広告画像においてクリックの 予測に寄与する箇所を特定 ○ Saliency mapによって 予測に寄与する部分を可視化

Slide 11

Slide 11 text

広告クリエイティブと 機械学習技術における 現状と展望 人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 11 配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] Conversion Prediction Using Multi-task Conditional Attention Networks to Support the Creation of Effective Ad Creatives. Shunsuke Kitada, Hitoshi Iyatomi (Hosei Univ.), Yoshifumi Seki (Gunosy Inc.). ADS, Poster#100

Slide 12

Slide 12 text

研究背景 | 作成支援に向けたクリエイティブの評価 12 ● 配信効果の高いクリエイティブ作成支援は重要 ○ コンバージョン(CV)が多い広告は一般的に効果が高い ○ 既存や入稿されたものを正しく評価するのは非常に難しい ● クリエイティブの良さを事前に推定 ○ CV数が多くなるであろうクリエイティブを事前に推定 ○ 良いクリエイティブ (e.g., テキスト文の内容) とは何か ➜ 効率的に作成可能で、作成支援や自動生成を目指せる テキストを対象とした 広告クリエイティブの評価 バナーは入れ替えることが 難しく固定の場合が多い テキストの入れ替えは 比較的容易であるため

Slide 13

Slide 13 text

研究背景 | 広告クリエイティブにおけるデータの性質 13 ● コンバージョン数はクリック数と比べて非常に不均衡 ○ 直接コンバージョンの性質を学習するのは困難を極める ● コンバージョン数とクリック数には強い相関 ○ 共通した特徴の学習により困難な学習を打破できる可能性 クリック数とコンバージョン数の分布 クリック数とコンバージョン数の相関関係 クリック数とCV数 頻度 クリック数 CV数

Slide 14

Slide 14 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 14 1) 広告クリエイティブの効果を正確に評価する枠組みの提案 a) マルチタスク学習を用いた不均衡データに対する学習 CVとクリックを同時に学習させることで困難な学習に 対する予測精度の向上を期待 b) Conditional attention機構の提案 予測精度向上と広告配信対象やクリエイティブの ジャンルといった属性値を考慮したattentionの決定 2) Attention可視化を用いた 広告クリエイティブの作成支援 Conditional attentionを用いた 重要単語の可視化に基づく クリエイティブ作成支援の検討

Slide 15

Slide 15 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 15

Slide 16

Slide 16 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 16 入力: クリエイティブの タイトル・説明文

Slide 17

Slide 17 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 17 出力 (マルチタスク学習): CV数・クリック数を 同時に出力・学習

Slide 18

Slide 18 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 18 Attentionの可視化: CV数・クリック数を 予測する際に寄与する単語

Slide 19

Slide 19 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 19 Attentionの可視化: CV数・クリック数を 予測する際に寄与する単語 特にCV数が高いデータに対して どのような言い回しが効果的か ➜ 作成支援につながる 可能性

Slide 20

Slide 20 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 20 Conditional attention: クリエイティブの属性値を 考慮した動的なattention 配信対象(性別)や広告の ジャンルにより変化する 提案手法

Slide 21

Slide 21 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 21 Conditional attentionで 女性属性を付与した場合: “ダイエット”や”女子”に注目

Slide 22

Slide 22 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 22 Conditional attentionで 男性属性を付与した場合: “具体的な数値”や”方法”に注目

Slide 23

Slide 23 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 23 提案手法の評価 ● 一般的な評価 ○ Mean squared error (MSE) ■ Ground truthとの誤差を計算する。小さいほど良い ● 高CVのクリエイティブを正確に予測できているかを評価 ○ Normalized discounted cumulative gain (NDCG) ■ i 番目の順位に対する評価指標。大きいほど良い ■ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) ● 表示回数 (インプレッション) が極端に少ないものは除外 ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化

Slide 24

Slide 24 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 24 提案手法の評価 ● 一般的な評価 ○ Mean squared error (MSE) ■ Ground truthとの誤差を計算する。小さいほど良い ● 高CVのクリエイティブを正確に予測できているかを評価 ○ Normalized discounted cumulative gain (NDCG) ■ i 番目の順位に対する評価指標。大きいほど良い ■ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) ● 表示回数 (インプレッション) が極端に少ないものは除外 ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化

Slide 25

Slide 25 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 25 提案手法の評価 ● 一般的な評価 ○ Mean squared error (MSE) ■ Ground truthとの誤差を計算する。小さいほど良い ● 高CVのクリエイティブを正確に予測できているかを評価 ○ Normalized discounted cumulative gain (NDCG) ■ i 番目の順位に対する評価指標。大きいほど良い ■ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) ● 表示回数 (インプレッション) が極端に少ないものは除外 ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化 Creative #1 CV数 小 Creative #2 Creative #... Creative #N CV数 大 予測CV数 大

Slide 26

Slide 26 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 26 提案手法の評価 ● 一般的な評価 ○ Mean squared error (MSE) ■ Ground truthとの誤差を計算する。小さいほど良い ● 高CVのクリエイティブを正確に予測できているかを評価 ○ Normalized discounted cumulative gain (NDCG) ■ i 番目の順位に対する評価指標。大きいほど良い ■ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) ● 表示回数 (インプレッション) が極端に少ないものは除外 ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化 Creative #1 CV数 小 Creative #2 Creative #... Creative #N CV数 大 予測CV数 大 CVが多いクリエイティブを 正しく評価できる

Slide 27

Slide 27 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 27 提案手法の評価 ● 一般的な評価 ○ Mean squared error (MSE) ■ Ground truthとの誤差を計算する。小さいほど良い ● 高CVのクリエイティブを正確に予測できているかを評価 ○ Normalized discounted cumulative gain (NDCG) ■ i 番目の順位に対する評価指標。大きいほど良い ■ 上位の評価の結果が全体の評価結果に影響を与える 評価用データセット Gunosyで配信された広告クリエイティブ (‘17 / 8 -’18 / 8) ● 表示回数 (インプレッション) が極端に少ないものは除外 ● MeCab w/ mecab-ipadic-neologdを用いて分かち書きし、 事前学習済みw2vで単語をベクトル化

Slide 28

Slide 28 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 28 MSEを評価指標としたときの比較結果 ● All: 評価対象のクリエイティブすべてに対して評価 ● #CV>0: CV数0以上のクリエイティブに対して評価 すべてCV数を0と予測した場合においても比較的良い結果 → MSEのみで評価するのは難しい

Slide 29

Slide 29 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 29 NDCGを評価指標としたときの比較結果 ● All: 評価対象のクリエイティブすべてに対して評価 ● #CV top 1 %: CV数上位1%のクリエイティブに対して評価 CV数の多いクリエイティブに対する予測精度が 約4% 程度向上 ➜ 配信効果の高いクリエイティブを正確に予測することが可能

Slide 30

Slide 30 text

配信効果の高いテキスト文の予測と可視化 [Kitada+ KDD19] 30 Conditional attentionによる属性値を変化させた時の可視化 ● 男性対象だと「男性」が発火している ● 全体的な傾向として「〇〇監修」が発火しやすい ➜ 有名人の人名が強く、それに共起している場合が多い 配信対象に適した広告文の性質を直感的に捉えることが可能 可視化結果を元に広告文の作成や修正の支援を担える可能性

Slide 31

Slide 31 text

広告クリエイティブと 機械学習技術における 現状と展望 人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 31 関連研究事例 広告クリエイティブの作成支援と自動生成

Slide 32

Slide 32 text

キーワード推薦による作成支援 [Mishra+ RecSys19; Zhou+ WWW20] 32 キーワード推薦 (単語単体) ● 与えられたブランドに対して推薦 ● キーワードが関連しているかどうかを ランキングベースのDeepモデルで学習 キーフレーズ推薦 (複数の単語) ● マルチモーダルを用いたTransformer ベースのモデル (LXMERT [Tan+ EMNLP19]) ○ 広告画像・OCRによるテキスト・Wikipedia情報 ● VQAの問題として分類とランキングの側面から定式化 ○ 「なぜ買うべきか」 という質問に対する 回答が付与されている 公開データセットを 使用 [Hussain+ CVPR17]

Slide 33

Slide 33 text

広告クリエイティブの自動生成 [Hughes+ KDD19] 33 ランディングページ (LP) の情報を元に CTRが高い検索連動型広告のテキストを自動生成する ● Bing Ads (Microsoft) LPから要約技術を元に広告文を生成 ○ 事前学習としてcross entropyのみで要約タスクを学習 ○ REINFORCE [Williams ML92] でCTRを最大化するよう学習 ■ CTRを予測するoracle model [Ling+ WWW17] を使用 ○ 600,000 のLPと広告のペアからモデルを学習 ● 評価結果 ○ 無料のサービスや具体的な数値がより多く含まれている (freeが含まれている) (広告の魅力を高めている [Thomaidou Ph.D thesis14] )

Slide 34

Slide 34 text

広告クリエイティブと 機械学習技術における 現状と展望 人工知能学会第34回全国大会 (JSAI2020) オーガナイズドセッション “広告とAI” 34 広告クリエイティブと機械学習技術における まとめと今後の展望

Slide 35

Slide 35 text

まとめと今後の展望 35 ● 研究対象が広告配信アルゴリズムから 広告のワークフロー全体に広がっている ○ 広告クリエイティブの作成・運用はその中心 ○ ベンチマークとなるデータセットなどはないので 共通タスクになっていないが、重要性は認識されている ● 世界トップ企業は学術的にも価値のある取り組みを遂行 ○ 技術的に洗練されているため競争優位がある ■ 世界トップ企業に遅れを取ってしまう可能性が高い ○ 学術界からのキャッチアップだけでなく、 産業界からも新たな技術を生み出していくべき ● より産学での連携が重要性を増す ○ データが必要だが、公開は難しい領域 ○ 企業内の研究力や共同研究での生産性アップが重要

Slide 36

Slide 36 text

参考文献 36 ● [Williams ML92] Williams, Ronald J. "Simple statistical gradient-following algorithms for connectionist reinforcement learning." Machine learning 8.3-4 (1992): 229-256. ● [Azimi+ CIKM12] Azimi et al. "Visual appearance of display ads and its effect on click through rate." Proc. of CIKM 2012. ● [Thomaidou Ph.D thesis14] Thomaidou, Stamatina. Automated Creation and Optimization of Online Advertising Campaigns. Diss. Ph. D. thesis, Department of Informatics, Athens University of Economics and Business, 2014. ● [Chen+ ACMMM16] Chen et al. "Deep ctr prediction in display advertising." Proc. of ACM MM 2016. ● [Ling+ WWW17] Ling et al. "Model ensemble for click prediction in bing search ads." Proc. of WWW 2017. ● [Lu+ ADKDD17] Lu et al. "A practical framework of conversion rate prediction for online display advertising." Proc. of ADKDD 2017. ● [Hussain+ CVPR17] Hussain et al. "Automatic understanding of image and video advertisements." Proc. of CVPR 2017. ● [Maehara+ IJCAI18] Maehara et al. "Optimal bidding strategy for brand advertising." Proc. of IJCAI 2018. ● [Hughes+ KDD19] Hughes et al. “Generating Better Search Engine Text Advertisements with Deep Reinforcement Learning.” Proc. of KDD 2019.

Slide 37

Slide 37 text

参考文献 37 ● [Kitada+ KDD19] Kitada et al. "Conversion Prediction Using Multi-task Conditional Attention Networks to Support the Creation of Effective Ad Creatives." Proc. of KDD 2019. ● [Mishra+ RecSys19] Mishra et al. "Guiding creative design in online advertising." Proc. of RecSys 2019. ● [Tan+ EMNLP19] Tan, Hao, and Mohit Bansal. "LXMERT: Learning Cross-Modality Encoder Representations from Transformers." Proc. of EMNLP-IJCNLP 2019. ● [Zhou+ WWW20] Zhou et al. “Recommending Themes for Ad Creative Design via Visual-Linguistic Representations.” Proc. of WWW 2020.