Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NAACL/EACL読み会2021_NEUROLOGIC DECDING: (Un)super...
Search
maskcott
July 26, 2021
Research
0
30
NAACL/EACL読み会2021_NEUROLOGIC DECDING: (Un)supervised Neural Text Generation with Predicate Logic Constraints
maskcott
July 26, 2021
Tweet
Share
More Decks by maskcott
See All by maskcott
論文紹介2022後期(EMNLP2022)_Towards Opening the Black Box of Neural Machine Translation: Source and Target Interpretations of the Transformer
maskcott
0
47
論文紹介2022後期(ACL2022)_DEEP: DEnoising Entity Pre-training for Neural Machine Translation
maskcott
0
24
PACLIC2022_Japanese Named Entity Recognition from Automatic Speech Recognition Using Pre-trained Models
maskcott
0
14
WAT2022_TMU NMT System with Automatic Post-Editing by Multi-Source Levenshtein Transformer for the Restricted Translation Task of WAT 2022
maskcott
0
31
論文紹介2022前期_Redistributing Low Frequency Words: Making the Most of Monolingual Data in Non-Autoregressive Translation
maskcott
0
36
論文紹介2021後期_Analyzing the Source and Target Contributions to Predictions in Neural Machine Translation
maskcott
0
58
WAT2021_Machine Translation with Pre-specified Target-side Words Using a Semi-autoregressive Model
maskcott
0
26
論文紹介2021前期_Bilingual Dictionary Based Neural Machine Translation without Using Parallel Sentences
maskcott
0
27
poster.NAACL-SRW_Two Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation
maskcott
0
76
Other Decks in Research
See All in Research
Batch Processing Algorithm for Elliptic Curve Operations and Its AVX-512 Implementation
herumi
0
120
書き手はどこを訪れたか? - 言語モデルで訪問行動を読み取る -
hiroki13
0
150
Poster: Feasibility of Runtime-Neutral Wasm Instrumentation for Edge-Cloud Workload Handover
chikuwait
0
360
BtoB プロダクトにおけるインサイトマネジメントの必要性 現場ドリブンなカミナシがインサイトマネジメントに取り組むワケ / Why field-driven Kaminashi is working on insight management
kaminashi
1
300
DeepSeek を利用する上でのリスクと安全性の考え方
schroneko
3
860
言語モデルLUKEを経済の知識に特化させたモデル「UBKE-LUKE」について
petter0201
0
250
研究を支える拡張性の高い ワークフローツールの提案 / Proposal of highly expandable workflow tools to support research
linyows
0
320
医療支援AI開発における臨床と情報学の連携を円滑に進めるために
moda0
0
150
Prithvi-EO-2.0: A Versatile Multi-Temporal Foundation Model for Earth Observation Applications
satai
3
160
JSAI NeurIPS 2024 参加報告会(AI アライメント)
akifumi_wachi
5
860
20241226_くまもと公共交通新時代シンポジウム
trafficbrain
0
430
Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)
onely7
24
6k
Featured
See All Featured
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Done Done
chrislema
182
16k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Testing 201, or: Great Expectations
jmmastey
42
7.2k
How GitHub (no longer) Works
holman
314
140k
Why Our Code Smells
bkeepers
PRO
336
57k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.2k
Being A Developer After 40
akosma
89
590k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
175
52k
Designing on Purpose - Digital PM Summit 2013
jponch
117
7.1k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
440
Bash Introduction
62gerente
611
210k
Transcript
発表者: 小町研 M1 今藤誠一郎 2021/07/26 @NAACL/EACL2021 1
Abstract タスク • ニューラル言語モデルの複雑な語彙制約下におけるテキスト生成 提案手法 • NEUROLOGIC DECODING ◦ 述語論理で表現可能なあらゆる語彙制約を扱うことが可能
◦ ビームサーチと同等の実行時間 ◦ 4つのベンチマークにおいて有効性を確認 ◦ 教師なしモデルに適用すると、従来のデコーディングを用いた教師ありモデルよりも優れ た結果を確認 2
Introduction • このようなタスクにおけるこれまでの主要な手法 → 事前学習された言語モデルをfine-tuning • fine-tuningに大量のデータを用いても、制約を満たすこと を保証するわけではなく上手くいかない ↓ •
デコーディングを制御することで制約の充足を強制 • 制約は、任意の述語論理式として表現される → 論理的制約をデコード時の目的関数のペナルティ項に 変換する 3 • テキスト生成タスクにおいて意味的な制約を含むことはしばしばある
Predicate Logic Constraint • 述語論理式D(a, y)を以下で定義:yの中にaが含まれているかどうか • 制約は次のようなCNFで表現できる → 次式の最適化
4
Algorithm • CNFを最適化する網羅的な探索は困難 → beam探索に基づいた推論 • pruning step, grouping step,
selecting stepの3段階からなる • 各タイムステップで k×|V| の スコア行列の生成と同時に、次の新しい候補 hのそれぞれについ ても考慮した制約の状態を生成する( kはbeam幅) 5
Pruning step 6
Grouping step 7
Selecting step 8 部分的に条件を満 たした場合のプレ フィックスの割合
Experiments I: Constrained Commonsense Generation • コンセプトが与えられるので、それを含むシンプルかつ文法的な文を生成するタスク • 定式化: •
モデル ◦ GPT-2 (Radford et al., 2019) ◦ UniLM (Dong et al., 2019) ◦ UniLM-v2 (Bao et al., 2020) ◦ BERT-Gen (Bao et al., 2020) ◦ BART (Lewis et al.,2020) ◦ T5 (Raffel et al., 2019) 9 コンセプト 入力 a i の語尾変化
10 Results I: NEUROLOGIC vs Other Decoding Methods • 先行研究の制約付きのための手法
→ 制約を満たしているが、生成文の質を下げ ている • 提案手法は先行研究以上に制約を満たしなが ら、全評価指標において制約なしのものよりも 高いスコアを出している 制約有 制約無
11 Results II: NEUROLOGIC across Different Supervised Models Results III:
NEUROLOGIC with Unsupervised Models concept 使わない
12 Results IV: Ablation • 従来の手法では学習データを全て使用しても制約を満たせない 学習データ無しの提案手法にも及ばない • 提案手法がどのモデルサイズでも従来の手法を大きく上回る •
提案手法を用いると教師なしでも教師なしと同等の性能 • 特にモデルサイズが小さい時に従来手法との差が見られた
Experiments II: Recipe Generation 定式化 13 全材料 レシピに含まれる材料 (単語orフレーズ) •
提案手法を用いると、ほぼ全ての必要な材料を出力で きており、さらに余計な材料をほとんど出力しないこと を確認 • 既存の生成モデルに提案手法を組み込むことで、計算 コストを増やすことなく、出力の制御と生成文の質の向 上を実現できる 材料のより広い名称 (onion→vegetable的なの)
Experiments III: Data-Grounded Dialogue Response Generation 定式化: • 事実から応答文のテンプレを作成 •
Seq2Seqでは学習データにないものは対応で きない → GPT2のzero shotを利用 • 提案手法を用いたzero shotは教師ありの ベースラインを上回るか同等の結果が得られ た → 余計に計算コストをかけてfine tuningする 必要がないことを示唆 14 attributeとvalueからなる事実の集合(accepts_credit_cards=“yes”)
Experiment IV: Reducing Gender Bias in Machine Translation 定式化: •
提案手法を用いることで30pt以上の改善(正確 に性別を訳せている) • 性別のステレオタイプに対する依存を減らすのに も効果的である 15 女性に関係する名詞 男性に関係する名詞 女性語形変化 男性語形変化 原言語(en)側のcorreference modelを利用
Conclusion • 任意の述語論理制約に基づいた生成をするための簡単で効率的かつ汎用的な手 法であるNEUROLOGIC DECODINGを提案 • 既存のモデルを拡張する形で複数のタスクに適用したところ、幅広くかつ一貫して 出力文の質を向上させることを示した 16
Constraint States 17
Example 18