Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NAACL/EACL読み会2021_NEUROLOGIC DECDING: (Un)super...
Search
maskcott
July 26, 2021
Research
0
36
NAACL/EACL読み会2021_NEUROLOGIC DECDING: (Un)supervised Neural Text Generation with Predicate Logic Constraints
maskcott
July 26, 2021
Tweet
Share
More Decks by maskcott
See All by maskcott
論文紹介2022後期(EMNLP2022)_Towards Opening the Black Box of Neural Machine Translation: Source and Target Interpretations of the Transformer
maskcott
0
57
論文紹介2022後期(ACL2022)_DEEP: DEnoising Entity Pre-training for Neural Machine Translation
maskcott
0
26
PACLIC2022_Japanese Named Entity Recognition from Automatic Speech Recognition Using Pre-trained Models
maskcott
0
23
WAT2022_TMU NMT System with Automatic Post-Editing by Multi-Source Levenshtein Transformer for the Restricted Translation Task of WAT 2022
maskcott
0
40
論文紹介2022前期_Redistributing Low Frequency Words: Making the Most of Monolingual Data in Non-Autoregressive Translation
maskcott
0
42
論文紹介2021後期_Analyzing the Source and Target Contributions to Predictions in Neural Machine Translation
maskcott
0
68
WAT2021_Machine Translation with Pre-specified Target-side Words Using a Semi-autoregressive Model
maskcott
0
37
論文紹介2021前期_Bilingual Dictionary Based Neural Machine Translation without Using Parallel Sentences
maskcott
0
32
poster.NAACL-SRW_Two Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation
maskcott
0
98
Other Decks in Research
See All in Research
Stealing LUKS Keys via TPM and UUID Spoofing in 10 Minutes - BSides 2025
anykeyshik
0
140
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
170
Unsupervised Domain Adaptation Architecture Search with Self-Training for Land Cover Mapping
satai
3
200
不確実性下における目的と手段の統合的探索に向けた連続腕バンディットの応用 / iot70_gp_rff_mab
monochromegane
2
190
20250624_熊本経済同友会6月例会講演
trafficbrain
1
670
EOGS: Gaussian Splatting for Efficient Satellite Image Photogrammetry
satai
4
650
SSII2025 [TS3] 医工連携における画像情報学研究
ssii
PRO
3
1.3k
Language Models Are Implicitly Continuous
eumesy
PRO
0
290
「どう育てるか」より「どう働きたいか」〜スクラムマスターの最初の一歩〜
hirakawa51
0
930
EarthSynth: Generating Informative Earth Observation with Diffusion Models
satai
3
370
J-RAGBench: 日本語RAGにおける Generator評価ベンチマークの構築
koki_itai
0
680
Sat2City:3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
satai
3
120
Featured
See All Featured
The Invisible Side of Design
smashingmag
301
51k
Six Lessons from altMBA
skipperchong
28
4k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
51k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.6k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
6.1k
We Have a Design System, Now What?
morganepeng
53
7.8k
Making the Leap to Tech Lead
cromwellryan
135
9.6k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Transcript
発表者: 小町研 M1 今藤誠一郎 2021/07/26 @NAACL/EACL2021 1
Abstract タスク • ニューラル言語モデルの複雑な語彙制約下におけるテキスト生成 提案手法 • NEUROLOGIC DECODING ◦ 述語論理で表現可能なあらゆる語彙制約を扱うことが可能
◦ ビームサーチと同等の実行時間 ◦ 4つのベンチマークにおいて有効性を確認 ◦ 教師なしモデルに適用すると、従来のデコーディングを用いた教師ありモデルよりも優れ た結果を確認 2
Introduction • このようなタスクにおけるこれまでの主要な手法 → 事前学習された言語モデルをfine-tuning • fine-tuningに大量のデータを用いても、制約を満たすこと を保証するわけではなく上手くいかない ↓ •
デコーディングを制御することで制約の充足を強制 • 制約は、任意の述語論理式として表現される → 論理的制約をデコード時の目的関数のペナルティ項に 変換する 3 • テキスト生成タスクにおいて意味的な制約を含むことはしばしばある
Predicate Logic Constraint • 述語論理式D(a, y)を以下で定義:yの中にaが含まれているかどうか • 制約は次のようなCNFで表現できる → 次式の最適化
4
Algorithm • CNFを最適化する網羅的な探索は困難 → beam探索に基づいた推論 • pruning step, grouping step,
selecting stepの3段階からなる • 各タイムステップで k×|V| の スコア行列の生成と同時に、次の新しい候補 hのそれぞれについ ても考慮した制約の状態を生成する( kはbeam幅) 5
Pruning step 6
Grouping step 7
Selecting step 8 部分的に条件を満 たした場合のプレ フィックスの割合
Experiments I: Constrained Commonsense Generation • コンセプトが与えられるので、それを含むシンプルかつ文法的な文を生成するタスク • 定式化: •
モデル ◦ GPT-2 (Radford et al., 2019) ◦ UniLM (Dong et al., 2019) ◦ UniLM-v2 (Bao et al., 2020) ◦ BERT-Gen (Bao et al., 2020) ◦ BART (Lewis et al.,2020) ◦ T5 (Raffel et al., 2019) 9 コンセプト 入力 a i の語尾変化
10 Results I: NEUROLOGIC vs Other Decoding Methods • 先行研究の制約付きのための手法
→ 制約を満たしているが、生成文の質を下げ ている • 提案手法は先行研究以上に制約を満たしなが ら、全評価指標において制約なしのものよりも 高いスコアを出している 制約有 制約無
11 Results II: NEUROLOGIC across Different Supervised Models Results III:
NEUROLOGIC with Unsupervised Models concept 使わない
12 Results IV: Ablation • 従来の手法では学習データを全て使用しても制約を満たせない 学習データ無しの提案手法にも及ばない • 提案手法がどのモデルサイズでも従来の手法を大きく上回る •
提案手法を用いると教師なしでも教師なしと同等の性能 • 特にモデルサイズが小さい時に従来手法との差が見られた
Experiments II: Recipe Generation 定式化 13 全材料 レシピに含まれる材料 (単語orフレーズ) •
提案手法を用いると、ほぼ全ての必要な材料を出力で きており、さらに余計な材料をほとんど出力しないこと を確認 • 既存の生成モデルに提案手法を組み込むことで、計算 コストを増やすことなく、出力の制御と生成文の質の向 上を実現できる 材料のより広い名称 (onion→vegetable的なの)
Experiments III: Data-Grounded Dialogue Response Generation 定式化: • 事実から応答文のテンプレを作成 •
Seq2Seqでは学習データにないものは対応で きない → GPT2のzero shotを利用 • 提案手法を用いたzero shotは教師ありの ベースラインを上回るか同等の結果が得られ た → 余計に計算コストをかけてfine tuningする 必要がないことを示唆 14 attributeとvalueからなる事実の集合(accepts_credit_cards=“yes”)
Experiment IV: Reducing Gender Bias in Machine Translation 定式化: •
提案手法を用いることで30pt以上の改善(正確 に性別を訳せている) • 性別のステレオタイプに対する依存を減らすのに も効果的である 15 女性に関係する名詞 男性に関係する名詞 女性語形変化 男性語形変化 原言語(en)側のcorreference modelを利用
Conclusion • 任意の述語論理制約に基づいた生成をするための簡単で効率的かつ汎用的な手 法であるNEUROLOGIC DECODINGを提案 • 既存のモデルを拡張する形で複数のタスクに適用したところ、幅広くかつ一貫して 出力文の質を向上させることを示した 16
Constraint States 17
Example 18