Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NAACL/EACL読み会2021_NEUROLOGIC DECDING: (Un)super...
Search
maskcott
July 26, 2021
Research
0
28
NAACL/EACL読み会2021_NEUROLOGIC DECDING: (Un)supervised Neural Text Generation with Predicate Logic Constraints
maskcott
July 26, 2021
Tweet
Share
More Decks by maskcott
See All by maskcott
論文紹介2022後期(EMNLP2022)_Towards Opening the Black Box of Neural Machine Translation: Source and Target Interpretations of the Transformer
maskcott
0
46
論文紹介2022後期(ACL2022)_DEEP: DEnoising Entity Pre-training for Neural Machine Translation
maskcott
0
23
PACLIC2022_Japanese Named Entity Recognition from Automatic Speech Recognition Using Pre-trained Models
maskcott
0
12
WAT2022_TMU NMT System with Automatic Post-Editing by Multi-Source Levenshtein Transformer for the Restricted Translation Task of WAT 2022
maskcott
0
28
論文紹介2022前期_Redistributing Low Frequency Words: Making the Most of Monolingual Data in Non-Autoregressive Translation
maskcott
0
34
論文紹介2021後期_Analyzing the Source and Target Contributions to Predictions in Neural Machine Translation
maskcott
0
58
WAT2021_Machine Translation with Pre-specified Target-side Words Using a Semi-autoregressive Model
maskcott
0
23
論文紹介2021前期_Bilingual Dictionary Based Neural Machine Translation without Using Parallel Sentences
maskcott
0
26
poster.NAACL-SRW_Two Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation
maskcott
0
70
Other Decks in Research
See All in Research
20240918 交通くまもとーく 未来の鉄道網編(こねくま)
trafficbrain
0
260
チュートリアル:Mamba, Vision Mamba (Vim)
hf149
5
1.4k
日本語医療LLM評価ベンチマークの構築と性能分析
fta98
3
690
EBPMにおける生成AI活用について
daimoriwaki
0
210
医療支援AI開発における臨床と情報学の連携を円滑に進めるために
moda0
0
120
Geospecific View Generation - Geometry-Context Aware High-resolution Ground View Inference from Satellite Views
satai
1
110
文書画像のデータ化における VLM活用 / Use of VLM in document image data conversion
sansan_randd
2
240
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction
sosk
1
960
Weekly AI Agents News! 8月号 プロダクト/ニュースのアーカイブ
masatoto
1
200
Consciously drifting
fumiyaakasaka
0
100
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
590
いしかわ暮らしセミナー~移住にまつわるお金の話~
matyuda
0
150
Featured
See All Featured
Building an army of robots
kneath
302
43k
Fireside Chat
paigeccino
34
3k
The World Runs on Bad Software
bkeepers
PRO
65
11k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.3k
Testing 201, or: Great Expectations
jmmastey
40
7.1k
We Have a Design System, Now What?
morganepeng
50
7.2k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Speed Design
sergeychernyshev
25
640
A Philosophy of Restraint
colly
203
16k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
93
17k
How to train your dragon (web standard)
notwaldorf
88
5.7k
The Cost Of JavaScript in 2023
addyosmani
45
6.9k
Transcript
発表者: 小町研 M1 今藤誠一郎 2021/07/26 @NAACL/EACL2021 1
Abstract タスク • ニューラル言語モデルの複雑な語彙制約下におけるテキスト生成 提案手法 • NEUROLOGIC DECODING ◦ 述語論理で表現可能なあらゆる語彙制約を扱うことが可能
◦ ビームサーチと同等の実行時間 ◦ 4つのベンチマークにおいて有効性を確認 ◦ 教師なしモデルに適用すると、従来のデコーディングを用いた教師ありモデルよりも優れ た結果を確認 2
Introduction • このようなタスクにおけるこれまでの主要な手法 → 事前学習された言語モデルをfine-tuning • fine-tuningに大量のデータを用いても、制約を満たすこと を保証するわけではなく上手くいかない ↓ •
デコーディングを制御することで制約の充足を強制 • 制約は、任意の述語論理式として表現される → 論理的制約をデコード時の目的関数のペナルティ項に 変換する 3 • テキスト生成タスクにおいて意味的な制約を含むことはしばしばある
Predicate Logic Constraint • 述語論理式D(a, y)を以下で定義:yの中にaが含まれているかどうか • 制約は次のようなCNFで表現できる → 次式の最適化
4
Algorithm • CNFを最適化する網羅的な探索は困難 → beam探索に基づいた推論 • pruning step, grouping step,
selecting stepの3段階からなる • 各タイムステップで k×|V| の スコア行列の生成と同時に、次の新しい候補 hのそれぞれについ ても考慮した制約の状態を生成する( kはbeam幅) 5
Pruning step 6
Grouping step 7
Selecting step 8 部分的に条件を満 たした場合のプレ フィックスの割合
Experiments I: Constrained Commonsense Generation • コンセプトが与えられるので、それを含むシンプルかつ文法的な文を生成するタスク • 定式化: •
モデル ◦ GPT-2 (Radford et al., 2019) ◦ UniLM (Dong et al., 2019) ◦ UniLM-v2 (Bao et al., 2020) ◦ BERT-Gen (Bao et al., 2020) ◦ BART (Lewis et al.,2020) ◦ T5 (Raffel et al., 2019) 9 コンセプト 入力 a i の語尾変化
10 Results I: NEUROLOGIC vs Other Decoding Methods • 先行研究の制約付きのための手法
→ 制約を満たしているが、生成文の質を下げ ている • 提案手法は先行研究以上に制約を満たしなが ら、全評価指標において制約なしのものよりも 高いスコアを出している 制約有 制約無
11 Results II: NEUROLOGIC across Different Supervised Models Results III:
NEUROLOGIC with Unsupervised Models concept 使わない
12 Results IV: Ablation • 従来の手法では学習データを全て使用しても制約を満たせない 学習データ無しの提案手法にも及ばない • 提案手法がどのモデルサイズでも従来の手法を大きく上回る •
提案手法を用いると教師なしでも教師なしと同等の性能 • 特にモデルサイズが小さい時に従来手法との差が見られた
Experiments II: Recipe Generation 定式化 13 全材料 レシピに含まれる材料 (単語orフレーズ) •
提案手法を用いると、ほぼ全ての必要な材料を出力で きており、さらに余計な材料をほとんど出力しないこと を確認 • 既存の生成モデルに提案手法を組み込むことで、計算 コストを増やすことなく、出力の制御と生成文の質の向 上を実現できる 材料のより広い名称 (onion→vegetable的なの)
Experiments III: Data-Grounded Dialogue Response Generation 定式化: • 事実から応答文のテンプレを作成 •
Seq2Seqでは学習データにないものは対応で きない → GPT2のzero shotを利用 • 提案手法を用いたzero shotは教師ありの ベースラインを上回るか同等の結果が得られ た → 余計に計算コストをかけてfine tuningする 必要がないことを示唆 14 attributeとvalueからなる事実の集合(accepts_credit_cards=“yes”)
Experiment IV: Reducing Gender Bias in Machine Translation 定式化: •
提案手法を用いることで30pt以上の改善(正確 に性別を訳せている) • 性別のステレオタイプに対する依存を減らすのに も効果的である 15 女性に関係する名詞 男性に関係する名詞 女性語形変化 男性語形変化 原言語(en)側のcorreference modelを利用
Conclusion • 任意の述語論理制約に基づいた生成をするための簡単で効率的かつ汎用的な手 法であるNEUROLOGIC DECODINGを提案 • 既存のモデルを拡張する形で複数のタスクに適用したところ、幅広くかつ一貫して 出力文の質を向上させることを示した 16
Constraint States 17
Example 18