Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オプトにおける自然言語生成の応用事例
Search
fhiyo
December 16, 2019
Research
780
6
Share
オプトにおける自然言語生成の応用事例
https://opt.connpass.com/event/156040/
で登壇した内容です
fhiyo
December 16, 2019
More Decks by fhiyo
See All by fhiyo
Security_Engineering___Third_Edition_Chapter.20.pdf
fhiyo
0
26
Security_Engineering___Third_Edition_Chapter.21.pdf
fhiyo
0
33
Git再入門
fhiyo
0
150
効果検証入門1章
fhiyo
1
530
言語処理のための機械学習入門 1.1〜1.4
fhiyo
0
96
【論文紹介】Forecasting at Scale
fhiyo
1
710
統計的因果探索に入門してみた
fhiyo
0
550
【論文紹介】Deep Inside Convolutional Networks Visualising Image Classification Models and Saliency Maps -- Simonyan Vedaldi Zisserman 2013 in ArXiv.pdf
fhiyo
0
1.6k
Other Decks in Research
See All in Research
業界横断 副業コンプライアンス調査 三者(副業者・本業先・発注者)におけるトラブル認知ギャップの構造分析
fkske
0
1.3k
IEEE AIxVR 2026 Keynote Talk: "Beyond Visibility: Understanding Scenes and Humans under Challenging Conditions with Diverse Sensing"
miso2024
0
180
「AIとWhyを深堀る」をAIと深堀る
iflection
0
370
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
940
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
150
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
580
2026年1月の生成AI領域の重要リリース&トピック解説
kajikent
0
1k
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
3.2k
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
660
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2.1k
論文紹介 "ReSim: Reliable World Simulation for Autonomous Driving"
kogo
0
510
COFFEE-Japan PROJECT Impact Report(海ノ向こうコーヒー)
ontheslope
0
1.6k
Featured
See All Featured
Crafting Experiences
bethany
1
140
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1.1k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
690
How to build a perfect <img>
jonoalderson
1
5.5k
Facilitating Awesome Meetings
lara
57
6.8k
Designing for humans not robots
tammielis
254
26k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
180
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
エンジニアに許された特別な時間の終わり
watany
106
240k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Bash Introduction
62gerente
615
210k
Transcript
オプトにおける 自然言語生成の応用事例 株式会社オプト 兵頭 沖 1
はじめに • 発表者 ◦ 兵頭 沖 (Twitter: @fhiyo_) ◦ 略歴
▪ 情報学修士 (アルゴリズム) ▪ 株式会社オプト (2018〜) • データインテリジェンスチーム所属 • 広告文の評価・生成のR&D • 内容 ◦ ニューラルネットワークを用いたテキストクリエイティブ生成のオプト内の応用 事例の紹介 ▪ ※ ルールベースでのアプローチも取り組んでいるが、今回は NNベースの紹介 ▪ ※ 途中経過の報告になります 2
アウトライン • オプトにおける自然言語生成の課題 • 要約タスクとしてみたクリエイティブ生成 • 現時点の出力サンプル • 今後の課題 3
オプトにおける自然言語生成の課題 4 入稿・運用 広告 1.2% B 0.7% C CTR 0.3%
A 制作 実績報告 ?
オプトにおける自然言語生成の課題 テキストクリエイティブ作成の自動支援 • 広告の入れ替え頻度の向上による利益率UP 生成システムに求められる条件 • 文として正しい出力 • 商材情報の反映 (嘘がない、重要な情報の漏れがない)
• ctrなど広告効果が高い • 既存の出力と被らない 5
テキストクリエイティブ作成の自動支援 • 広告の入れ替え頻度の向上による利益率UP 生成システムに求められる条件 • 文として正しい出力 • 商材情報の反映 (嘘がない、重要な情報の漏れがない) •
ctrなど広告効果が高い • 既存の出力と被らない オプトにおける自然言語生成の課題 6 要約タスクで解 いている問題 媒体最適化、取得が難しい情 報に依存した変数 対話文生成などで研究?
テキストクリエイティブ作成の自動支援 • 広告の入れ替え頻度の向上による利益率UP 生成システムに求められる条件 • 文として正しい出力 • 商材情報の反映 (嘘がない、重要な情報の漏れがない) •
ctrなど広告効果が高い • 既存の出力と被らない オプトにおける自然言語生成の課題 7 要約タスクで解 いている問題 媒体最適化、取得が難しい情 報に依存した変数 対話文生成などで研究 まずは上2つにフォーカスする 要約タスクに下2つの問題を解決するような制約式 を取り入れることができれば解けそう?
要約タスクとしてみたクリエイティブ生成 8 入力: 商品ページ 出力: テキスト広告 要約モデル
要約タスクとしてみたクリエイティブ生成 9 入力: 商品ページ 出力: テキスト 広告 要約モデル [問題設定] •
入力文はweb上の商品ページ、出力は テキスト広告 [課題] • データ量が多くない (ドメインごとに区切 ると少ない) • 要約ベンチマーク用タスクに比べて 入力 文の質が悪い • 商材固有の情報を多く含むので OOVの 対処は必須
要約タスクとしてみたクリエイティブ生成 [問題設定] • 入力文はweb上の商品ページ、出力は テキスト広告 [課題] • データ量が多くない (ドメインごとに区切 ると少ない)
• 要約ベンチマーク用タスクに比べて 入力 文の質が悪い • 商材固有の情報を多く含むので OOVの 対処は必須 10 copy mechanismの活用 (ex. copynet, pointer generator) 事前学習済みモデルの活用 (ex. UniLM, BERTSum, MASS)
事前学習済み言語モデルといえば 11 https://arxiv.org/abs/1810.04805 BERT [Devlin+, 2018] 事前訓練済みのモデルを利用して生成タスクを解く手法は最近のhot topic
copynet [Gu+, ACL 2016] 翻訳や要約のタスクは語彙に存在しない単語 (OOV) をどう出力するか?が課題 encoder-decoderで文を生成する際に、sourceの単語をコピーする能力を持たせたモ デル (attentionを用いてどのsourceに注目するか?を決定する)
12 https://www.aclweb.org/anthology/P16-1154/ ※ 厳密にはsub-wordにより OOVの問題は解消されるが、 copy-modeによる部分文字列 の出力を狙う
結果のサンプル 13 エレガンをサポートするブランド。。をおしセット受け入れることを サポートするブランド。。をおしセット受け入れることをサポートす るブランド。。をおしセット受け入れることをサポートするブラン ド。。をお求めの方 biLSTM + attention モデル
生成例 敏感肌」を予防する。健康な肌へ。 biLSTM + copynet 一人ひとりが更にアップブランド。 Transformer 毎日でもうるおいと香りで、清潔感肌へ導くスキン ケアブランド BERT + decoder + copynet
課題: loss・評価方法どうするか 要約タスクとは似て非なるタスク。対話文生成にも (一部) 似てる? 生成システムに求められる条件 (再掲) • 文として正しい出力 •
商材情報の反映 (嘘がない、重要が情報の漏れがない) • ctrなど広告効果が高い • 既存の出力と被らない これらの条件を上手く取り入れられるような評価方法を確立したい 14
その他今後の課題 • 事前学習済みモデルの軽量化 • 実用化の想定使用法の作成・環境作り • データ整備の方法 (入力文をもっとキレイにしたい) • デプロイ環境整備
• etc. 15
おわりに まとめ • オプトにおける自然言語生成の応用事例を紹介した • BERT + copynetで結構キレイに生成ができた? • 出力に多様性を持たせるための機構や評価方法の設計など、やりたいことはたくさ
んある 16