Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NAACL/EACL読み会2021_NEUROLOGIC DECDING: (Un)super...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
maskcott
July 26, 2021
Research
0
42
NAACL/EACL読み会2021_NEUROLOGIC DECDING: (Un)supervised Neural Text Generation with Predicate Logic Constraints
maskcott
July 26, 2021
Tweet
Share
More Decks by maskcott
See All by maskcott
論文紹介2022後期(EMNLP2022)_Towards Opening the Black Box of Neural Machine Translation: Source and Target Interpretations of the Transformer
maskcott
0
68
論文紹介2022後期(ACL2022)_DEEP: DEnoising Entity Pre-training for Neural Machine Translation
maskcott
0
36
PACLIC2022_Japanese Named Entity Recognition from Automatic Speech Recognition Using Pre-trained Models
maskcott
0
37
WAT2022_TMU NMT System with Automatic Post-Editing by Multi-Source Levenshtein Transformer for the Restricted Translation Task of WAT 2022
maskcott
0
45
論文紹介2022前期_Redistributing Low Frequency Words: Making the Most of Monolingual Data in Non-Autoregressive Translation
maskcott
0
59
論文紹介2021後期_Analyzing the Source and Target Contributions to Predictions in Neural Machine Translation
maskcott
0
77
WAT2021_Machine Translation with Pre-specified Target-side Words Using a Semi-autoregressive Model
maskcott
0
51
論文紹介2021前期_Bilingual Dictionary Based Neural Machine Translation without Using Parallel Sentences
maskcott
0
46
poster.NAACL-SRW_Two Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation
maskcott
0
110
Other Decks in Research
See All in Research
一般道の交通量減少と速度低下についての全国分析と熊本市におけるケーススタディ(20251122 土木計画学研究発表会)
trafficbrain
0
180
2026.01ウェビナー資料
elith
0
320
ScoreMatchingRiesz for Automatic Debiased Machine Learning and Policy Path Estimation with an Application to Japanese Monetary Policy Evaluation
masakat0
0
170
[チュートリアル] 電波マップ構築入門 :研究動向と課題設定の勘所
k_sato
0
340
2026 東京科学大 情報通信系 研究室紹介 (すずかけ台)
icttitech
0
990
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
620
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
820
第66回コンピュータビジョン勉強会@関東 Epona: Autoregressive Diffusion World Model for Autonomous Driving
kentosasaki
0
500
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
140
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
410
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2k
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
180
Featured
See All Featured
Measuring & Analyzing Core Web Vitals
bluesmoon
9
790
Balancing Empowerment & Direction
lara
5
960
Design in an AI World
tapps
0
180
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.1k
Faster Mobile Websites
deanohume
310
31k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
200
[SF Ruby Conf 2025] Rails X
palkan
2
850
Writing Fast Ruby
sferik
630
63k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.6k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
340
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
450
Transcript
発表者: 小町研 M1 今藤誠一郎 2021/07/26 @NAACL/EACL2021 1
Abstract タスク • ニューラル言語モデルの複雑な語彙制約下におけるテキスト生成 提案手法 • NEUROLOGIC DECODING ◦ 述語論理で表現可能なあらゆる語彙制約を扱うことが可能
◦ ビームサーチと同等の実行時間 ◦ 4つのベンチマークにおいて有効性を確認 ◦ 教師なしモデルに適用すると、従来のデコーディングを用いた教師ありモデルよりも優れ た結果を確認 2
Introduction • このようなタスクにおけるこれまでの主要な手法 → 事前学習された言語モデルをfine-tuning • fine-tuningに大量のデータを用いても、制約を満たすこと を保証するわけではなく上手くいかない ↓ •
デコーディングを制御することで制約の充足を強制 • 制約は、任意の述語論理式として表現される → 論理的制約をデコード時の目的関数のペナルティ項に 変換する 3 • テキスト生成タスクにおいて意味的な制約を含むことはしばしばある
Predicate Logic Constraint • 述語論理式D(a, y)を以下で定義:yの中にaが含まれているかどうか • 制約は次のようなCNFで表現できる → 次式の最適化
4
Algorithm • CNFを最適化する網羅的な探索は困難 → beam探索に基づいた推論 • pruning step, grouping step,
selecting stepの3段階からなる • 各タイムステップで k×|V| の スコア行列の生成と同時に、次の新しい候補 hのそれぞれについ ても考慮した制約の状態を生成する( kはbeam幅) 5
Pruning step 6
Grouping step 7
Selecting step 8 部分的に条件を満 たした場合のプレ フィックスの割合
Experiments I: Constrained Commonsense Generation • コンセプトが与えられるので、それを含むシンプルかつ文法的な文を生成するタスク • 定式化: •
モデル ◦ GPT-2 (Radford et al., 2019) ◦ UniLM (Dong et al., 2019) ◦ UniLM-v2 (Bao et al., 2020) ◦ BERT-Gen (Bao et al., 2020) ◦ BART (Lewis et al.,2020) ◦ T5 (Raffel et al., 2019) 9 コンセプト 入力 a i の語尾変化
10 Results I: NEUROLOGIC vs Other Decoding Methods • 先行研究の制約付きのための手法
→ 制約を満たしているが、生成文の質を下げ ている • 提案手法は先行研究以上に制約を満たしなが ら、全評価指標において制約なしのものよりも 高いスコアを出している 制約有 制約無
11 Results II: NEUROLOGIC across Different Supervised Models Results III:
NEUROLOGIC with Unsupervised Models concept 使わない
12 Results IV: Ablation • 従来の手法では学習データを全て使用しても制約を満たせない 学習データ無しの提案手法にも及ばない • 提案手法がどのモデルサイズでも従来の手法を大きく上回る •
提案手法を用いると教師なしでも教師なしと同等の性能 • 特にモデルサイズが小さい時に従来手法との差が見られた
Experiments II: Recipe Generation 定式化 13 全材料 レシピに含まれる材料 (単語orフレーズ) •
提案手法を用いると、ほぼ全ての必要な材料を出力で きており、さらに余計な材料をほとんど出力しないこと を確認 • 既存の生成モデルに提案手法を組み込むことで、計算 コストを増やすことなく、出力の制御と生成文の質の向 上を実現できる 材料のより広い名称 (onion→vegetable的なの)
Experiments III: Data-Grounded Dialogue Response Generation 定式化: • 事実から応答文のテンプレを作成 •
Seq2Seqでは学習データにないものは対応で きない → GPT2のzero shotを利用 • 提案手法を用いたzero shotは教師ありの ベースラインを上回るか同等の結果が得られ た → 余計に計算コストをかけてfine tuningする 必要がないことを示唆 14 attributeとvalueからなる事実の集合(accepts_credit_cards=“yes”)
Experiment IV: Reducing Gender Bias in Machine Translation 定式化: •
提案手法を用いることで30pt以上の改善(正確 に性別を訳せている) • 性別のステレオタイプに対する依存を減らすのに も効果的である 15 女性に関係する名詞 男性に関係する名詞 女性語形変化 男性語形変化 原言語(en)側のcorreference modelを利用
Conclusion • 任意の述語論理制約に基づいた生成をするための簡単で効率的かつ汎用的な手 法であるNEUROLOGIC DECODINGを提案 • 既存のモデルを拡張する形で複数のタスクに適用したところ、幅広くかつ一貫して 出力文の質を向上させることを示した 16
Constraint States 17
Example 18