Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[JSAI2022] 広告文自動生成に関する最近の研究動向

[JSAI2022] 広告文自動生成に関する最近の研究動向

JSAI2022の発表資料です。

村上聡一朗, 星野翔, 張培楠, "広告文自動生成に関する最近の研究動向", 2022年度 人工知能学会全国大会 (第36回) (2022.6)

8b0bb245cc397fd6ca91d143edd4a149?s=128

Soichiro Murakami

June 14, 2022
Tweet

More Decks by Soichiro Murakami

Other Decks in Research

Transcript

  1. 広告文自動生成に関する最近の研究動向
 村上 聡一朗, 星野 翔, 張 培楠
 株式会社サイバーエージェント
 JSAI2022(2022/06/14) 


  2. 本研究の概要
 • 背景
 ◦ インターネット広告の需要増加に伴い、自動生成の需要が高まる
 • 貢献
 ◦ これから広告文自動生成に取り組む方に向けて、最近の研究動向を整 理し、今後の課題を議論する


    2
 • 広告文の生成手法(テンプレート、ニューラル言語生成)
 • 広告文の評価手法(オンライン評価、オフライン評価)
 • 今後の課題(正確性、マルチモーダル情報、共有データセット)
  3. 広告文の例
 3
 検索連動型広告
 ディスプレイ広告
 キャッチコピー
 「そうだ、京都、行こう。」初回キャンペーン CM「1993年 盛秋・清水寺」より(出典: YouTube) 「そうだ、京都、行こう。」


    英会話 オンライン 検索クエリ(キーワード)
 https://www.google.com/
  4. 研究背景と目的
 4
 渋谷 脱毛 ランディングページ
 キーワード
 https://reginaclinic.jp/ 人手による制作
 https://www.google.com/

  5. 研究背景と目的
 5
 人手による制作
 渋谷 脱毛 ランディングページ
 キーワード
 https://reginaclinic.jp/ インターネット広告出稿額の推移(予測)
 需要増加に伴い、


    限界を迎えつつある 
 https://www.google.com/
  6. 6
 渋谷 脱毛 ランディングページ
 キーワード
 https://reginaclinic.jp/ 自動生成
 • これまで数多くの取り組みがある(テンプレート/ニューラル言語生成) 研究背景と目的


    インターネット広告出稿額の推移(予測)
 需要増加に伴い、
 限界を迎えつつある 
 https://www.google.com/
  7. 7
 渋谷 脱毛 ランディングページ
 キーワード
 https://reginaclinic.jp/ 最近の研究動向を俯瞰的に整理する 自動生成
 • これまで数多くの取り組みがある(テンプレート/ニューラル言語生成)

    • 需要増加に伴い、今後さらに注目されることが予想される 研究背景と目的
 インターネット広告出稿額の推移(予測)
 需要増加に伴い、
 限界を迎えつつある 
 需要増加が
 予測されている
 • 検索連動型広告
 • ディスプレイ広告
 • キャッチコピー
 https://www.google.com/
  8. 目次
 1. 研究背景と目的
 2. 広告文生成手法の概観
 ◦ テンプレートを用いた手法
 ◦ ニューラル言語生成による手法 


    3. 広告文生成の評価手法
 4. まとめと今後の課題
 8

  9. テンプレートを用いた手法
 • 事前に定義したテンプレートに対して、適切なキーワードを挿入する手法
 9
 <product name> with <feature set> <price>

    テンプレートを用いたテキスト生成の例 
 VIZIO ESeries with effective refresh rate, Low Price Guarantee 各slot(商品名, 特徴, 価格)を穴埋め 
 テンプレート
 生成テキスト
 引用: [Thomaidou, 2013]
  10. テンプレートを用いた手法
 • 事前に定義したテンプレートに対して、適切なキーワードを挿入する手法
 • Pros/Cons
 ◦ ✅ 文法・内容的に正確なテキストを生成可能
 ◦ ❌

    多様性向上のために数多くのテンプレートが必要 
 10

  11. テンプレートに関する研究の方向性
 • テンプレートの作成方法
 ◦ 人手による作成 [Fujita, 2010]
 ◦ 既存広告文(キャッチコピー)から抽出 [Alnajjar,

    2021] 
 • キーワードの抽出
 ◦ LPから各slotに挿入するキーワード候補を獲得する
 ◦ 自己相互情報量に基づきキーワード抽出後、極性判定でフィルタリング [Thomaidou, 2013]
 • キーワードの正規化
 ◦ テンプレートに合わせて、キーワードの並び順や書体を修正する [Bartz, 2008]
 11
 テンプレート キーワード 広告文 ×
 =

  12. ニューラル言語生成による手法
 • 最近では、機械翻訳や自動要約などで活用されているエンコーダ・デコーダモデルを用 いた手法が中心的になっている
 • Pros/Cons
 ◦ ✅ 入出力ペアデータからEnd-to-End学習が可能 


    ◦ ❌ 生成テキストに誤った内容が含まれるリスク 
 12
 Enc-Dec Model 効果が出る脱毛サロン - 脱毛するなら《ラココ》 全 身 脱 毛なら短 期 間で早い、安 い、痛みがないと口コミで評 判の ルミクス脱毛サロン ラココへ。SHR 方式のルミクス脱毛で全身脱毛も わずか30分、脱毛期間も1年!人 気の...
 https://la-coco.com/ 
 広告文
 ソース文書
 (LP等から取得)
 エンコーダ・デコーダモデルを用いた生成例 

  13. 入出力形式の選択肢
 13
 LPテキスト 広告文 CTR高い文 CTR低い文 広告文 キーワード キーワードからの生成
 CTRが高い文へ“翻訳”


    LPの内容を“要約”
 • 入力
 ◦ LPテキスト、既存広告文、キーワード 
 • 出力
 ◦ 広告文
 [Hughes+, 2019] [Mishra+, 2020] [脇本+, 2020] クリック率(CTR)
 =クリック数 ÷ インプレッション数
  14. ニューラル言語生成に関する研究の方向性
 14
 コンポーネント/手法 課題/背景 研究 コピー機構 関連性向上,未知語問題 [Hughes+,2019] [黒木+, 2021]

    変分オートエンコーダ 多様な広告文生成 [福田+, 2019] [川本+, 2019] 外部知識 低頻度キーワードへの対応 [Duan+, 2021] 強化学習 広告効果の考慮 [Hughes+, 2019] [Kamigaito+, 2021] 事前学習済み言語モデル 学習データ不足,学習の効率化 [Wang+, 2021]
  15. コピー機構の導入
 • 課題
 ◦ 広告文の関連性向上や未知語問題の対策として、コピー機構が広く用いられる 
 • 混合分布に基づく手法 [Hughes, 2019]

    
 ◦ 語彙からの生成確率とコピーする確率の重み付き和により算出 
 • 特殊トークンに基づく手法 [黒木, 2021] 
 ◦ 生成テキストの後処理として、特殊トークンを任意のキーワードへ置換 
 15
 効果が出る脱毛サロン - 脱毛するなら《ラココ》 全 身 脱 毛なら短 期 間で早い、安 い、痛みがないと口コミで評 判の ルミクス脱毛サロン ラココへ。SHR 方式のルミクス脱毛で全身脱毛も わずか30分、脱毛期間も1年!人 気の...
 入出力の単語の重なりが多いため、コピー機構が有効 
 エンジニア転職 - 料金満足度No.1 [MASK]転職 - 料金満足度No.1 生成文
 後処理
 生成文に対して任意のキーワードを挿入 

  16. 多様性の向上
 • 課題
 ◦ ユーザーへ同じ広告が繰り返し提示されることで、広告効果が低下する(広告の疲弊) 
 ◦ 多様な内容/言い回しの広告文を制作し続けることが求められる 
 •

    Variational Autoencoderを用いた生成
 ◦ キーワードによる条件付けで、 多様な内容の広告文を生成 [福田, 2019] 
 ◦ 品詞列による条件付けで、 多様なスタイルの広告文を生成 [川本, 2019] 
 16
 [川本+, 2019]より引用 

  17. 外部知識の活用
 • 課題
 ◦ 広告文を人手で制作することには限界があるため、よく検索されるキーワードが優先される 
 ◦ 低頻度なキーワードの学習データ不足により、検索意図にあった適切な広告文を生成できない 
 •

    キーワードと外部知識から広告文を生成 [Duan+, 2021] 
 ◦ 外部知識でキーワードの情報性を拡張し、低頻度キーワードに対して適切な広告文を生成 
 17
 iPhone
 Blackberry
 Blackberry
 Simple and Easy to Use! 高頻度キーワード
 広告文
 Fresh and Tasty! iPhone
 Simple and Easy to Use! キーワード
 広告文
 smartphone 知識
 グラフ
 Simple and Easy to Use! 低頻度キーワード
 外部知識を活用した広告文生成 
 低頻度キーワードに対して生成が難しい 

  18. 広告効果を報酬とした強化学習の適用
 • 課題
 ◦ 既存手法は最尤推定による学習のため、広告効果を考慮できていない 
 • Self-Critical Sequence Training(SCST)に基づく手法


    ◦ 推定クリック率(pCTR)を報酬として用いる [Hughes+, 2019] 
 ◦ 品質スコア、流暢性、関連性を考慮 [Kamigaito+, 2021]
 18
 Enc-Dec Model • 広告効果:CTR予測モデル
 • 流暢性:言語モデル
 • 関連性:キーワード含有を判定
 報酬関数 サンプリングで得 られた系列
 貪欲法で得られた系列 
 最尤推定に基づく損失 
 強化学習に基づく損失 
 モデルパラメータ更新 

  19. 事前学習済みモデルの活用
 • 背景
 ◦ タスク特有の学習データ不足等の課題から、事前学習済みモデルの活用が進んでいる 
 • 3段階の学習フェーズ [Wang+,2021]
 ◦

    魅力的な広告文の生成能力を段階的に獲得 
 ◦ Masked Seqeunce Generationにより学習を効率化 
 19
 BERT, GPT-2, T5, UniLM 事前学習
 (Wikipedia, book corpus)
 ファインチューニング
 (広告文)
 強化学習
 (予測CTR, 流暢性スコア 等) 
 基礎的な言語生成能力を獲得
 広告文の生成能力を獲得
 魅力的な広告文を生成

  20. 広告文生成の評価手法
 • オンライン評価
 ◦ 実際に広告を配信し、その 配信実績(CTR、収益率)に基づいて評価 する方法
 ◦ Pros/Cons
 ▪

    ✅ 最終的な目的に合った評価が可能 
 ▪ ❌ 実際の配信環境を用意する必要があるため時間を要する 
 • オフライン評価
 ◦ 広告文そのものをある評価基準に基づいて評価する方法 
 ▪ 自動評価
 ▪ 人手評価
 20

  21. オフライン評価の例
 • 自動評価
 ◦ 参照文との表層一致:BLEU、ROUGE、METOER、CIDEr 
 ◦ 多様性:distinct、self-BLEU、pairwise-BLEU 
 ◦

    広告特有:推定クリック率、キーワードを含む割合
 
 • 人手評価
 ◦ 流暢性(fluency, naturalness, readability) 
 ◦ 関連性(relevance, responsiveness, coherence) ※キーワードと広告文の関連度合い
 ◦ 魅力度(attractiveness)
 21
 エンジニア転職 - 料金満足度No.1 指定キーワードが含まれているか 
 評価方法:Side-by-side、リッカート尺度、Yesの割合 等 

  22. 評価方法 - Side-by-side
 22
 引用: [Wang+, 2021]
 検索クエリと広告文を提示し、評価 者が好みの方を選択 検索クエリ


    広告文
 魅力度(attractiveness)の評価 

  23. [参考]広告文生成のオフライン自動評価で用いられる評価基準の一覧
 23
 ※詳細は予稿に記載 
 Perplexity
 キーワードを含む割合, 予測CTR等


  24. • 最近の広告文自動生成における研究動向を整理した
 ◦ 生成手法
 ▪ テンプレートを用いた手法
 ▪ ニューラル言語生成による手法
 ◦ 評価手法


    ▪ オンライン評価(配信実績による評価) 
 ▪ オフライン評価(自動評価、人手評価) 
 24
 まとめ
 今後の方向性
 • 訴求内容や価格等の生成誤り   → 生成テキストの正確性の向上
 • 画像等の情報を活用できていない → マルチモーダル情報の活用
 • 先行研究との比較が難しい    → 共通データセットの拡充
 [村上+, 2022]

  25. 参考文献
 [Thomaidou+, 2013] Thomaidou, S., Lourentzou, I., Katsivelis- Perakis, P.,

    and Vazirgiannis, M.: Automated Snippet Generation for Online Advertising, in CIKM2013 (2013) 
 [Fujita+, 2010] Fujita, A., Ikushima, K., Sato, S., Kamite, R., Ishiyama, K., and Tamachi, O.: Automatic generation of listing ads by reusing promotional texts, in ICEC2010 (2010) 
 [Alnajjar+, 2021] Alnajjar, K. and Toivonen, H.: Computational gener- ation of slogans, Natural Language Engineering, Vol. 27, No. 5, p. 575–607 (2021) 
 [Bartz+, 2008] Bartz, K., Barr, C., and Aijaz, A.: Natural language gen- eration for sponsored-search advertisements, in ICEC2008 (2008) 
 [Hughes+, 2019] Hughes, J. W., Chang, K.-h., and Zhang, R.: Generat- ing Better Search Engine Text Advertisements with Deep Rein- forcement Learning, in KDD2019 (2019) 
 [Mishra+, 2020] Mishra, S., Verma, M., Zhou, Y., Thadani, K., and Wang, W.: Learning to Create Better Ads: Generation and Rank- ing Approaches for Ad Creative Refinement, in CIKM2020 (2020) 
 [脇本+, 2020] 脇本 宏平, 川本 峻頌, 張 培楠:インターネット広告におけるキー ワードに基づく広告文の自動生成, in JSAI2020 (2020) 
 [Hughes, 2019] Hughes, J. W., Chang, K.-h., and Zhang, R.: Generat- ing Better Search Engine Text Advertisements with Deep Rein- forcement Learning, in KDD2019 (2019) 
 [黒木, 2021] 黒木 開, 川上 孝介, 岩井 大志, 石塚 湖太, 中田 和秀:キーワード を考慮した BERT2BERT による広告文生成, in JSAI2021 (2021) 
 [福田, 2019] 福田 宏幸:キーワード条件つき変分 Autoencoder による広告文生 成, in JSAI2019 (2019) 
 [川本, 2019] 川本 峻頌, 張 培楠:スタイル制御を考慮した多様な広告文生成, in NLP2019 (2019) 
 [Duan+, 2021] Duan, S., Li, W., Cai, J., He, Y., and Wu, Y.: Query- Variant Advertisement Text Generation with Association Knowl- edge, in CIKM2021 (2021) 
 [Kamigaito+, 2021] Kamigaito, H., Zhang, P., Takamura, H., and Okumura, M.: An Empirical Study of Generating Texts for Search En- gine Advertising, in NAACL-HLT2021: Industry Papers (2021) 
 [Wang+,2021] Wang, X., Gu, X., Cao, J., Zhao, Z., Yan, Y., Middha, B., and Xie, X.: Reinforcing Pretrained Models for Generating At- tractive Text Advertisements, in KDD2021 (2021) 
 [村上+, 2022] 村上 聡一朗, 星野 翔, 張 培楠, 上垣外 英剛, 高村 大也, 奥村学: LP-to-Text: マルチモーダル広告文生成, in NLP2022 (2022) 
 [Iwama+, 2018] Iwama, K., Kano, Y., Japanese Advertising Slogan Generator using Case Frame and Word Vector, in INLG2018 (2018) 
 25
 図・イラスト  flat icon: https://www.flaticon.com/