Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
Grammatical Error Correction with Neural Reinforcement Learning
youichiro
June 05, 2018
Technology
0
98
Grammatical Error Correction with Neural Reinforcement Learning
長岡技術科学大学
自然言語処理研究室
文献紹介(2018-06-06)
youichiro
June 05, 2018
Tweet
Share
More Decks by youichiro
See All by youichiro
日本語文法誤り訂正における誤り傾向を考慮した擬似誤り生成
youichiro
0
700
分類モデルを用いた日本語学習者の格助詞誤り訂正
youichiro
0
43
Multi-Agent Dual Learning
youichiro
1
70
Automated Essay Scoring with Discourse-Aware Neural Models
youichiro
0
67
Context is Key- Grammatical Error Detection with Contextual Word Representations
youichiro
1
83
勉強勉強会
youichiro
0
44
Confusionset-guided Pointer Networks for Chinese Spelling Check
youichiro
0
110
A Neural Grammatical Error Correction System Built On Better Pre-training and Sequential Transfer Learning
youichiro
0
70
An Empirical Study of Incorporating Pseudo Data into Grammatical Error Correction
youichiro
0
120
Other Decks in Technology
See All in Technology
AI Company
shurain
0
230
Embedded SRE at Mercari
tcnksm
0
850
次期LTSに備えよ!AOS 6.1 HCI Core 編
smzksts
0
180
LIFF Deep Dive 2022
line_developers
PRO
1
450
AWS ChatbotでEC2インスタンスを 起動できるようにした
iwamot
0
160
Oracle Content Management サービス概要 (2022年5月版)
oracle4engineer
PRO
0
120
SRE_チーム立ち上げから1年_気づいたら_SRE_っぽくない仕事まで貢献しちゃってる説
bitkey
PRO
0
2.3k
スクラムマスターの「観察」スキルを掘り下げる / Scrum Fest Niigata 2022
ama_ch
0
690
⚡Lightdashを試してみた
k_data_analyst
0
210
事業の成長と共に歩む、ABEMA SRE探求の歴史 / SRE-Next 2022
nagaa052
0
290
Stripe Search APIを利用した、LINEとStripeの顧客情報連携/line-dc-202205
stripehideokamoto
0
130
ZOZOTOWNのProduction Readiness Checklistと信頼性向上の取り組み / Improvement the reliability of ZOZOTOWN with Production Readiness Checklist
akitok_
5
1.8k
Featured
See All Featured
ReactJS: Keep Simple. Everything can be a component!
pedronauck
655
120k
Teambox: Starting and Learning
jrom
121
7.6k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
268
11k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
498
130k
Three Pipe Problems
jasonvnalue
89
8.6k
Practical Orchestrator
shlominoach
178
8.6k
Producing Creativity
orderedlist
PRO
333
37k
Automating Front-end Workflow
addyosmani
1351
200k
VelocityConf: Rendering Performance Case Studies
addyosmani
316
22k
Mobile First: as difficult as doing things right
swwweet
212
7.5k
The Invisible Side of Design
smashingmag
289
48k
Fireside Chat
paigeccino
11
1.3k
Transcript
Grammatical Error Correction with Neural Reinforcement Learning Keisuke Sakaguchi, Matta
Post and Benjamin Van Durme Proceedings of the 8th International Joint Conference on Natural Language Processing, pages 366-372, 2017 ⽂献紹介(2018-06-06) ⻑岡技術科学⼤学 ⾃然⾔語処理研究室 ⼩川 耀⼀朗 1
Abstract l 強化学習を⽤いたニューラルエンコーダ・デコーダモデル l ⽂レベルの最適化が可能 l ⾃動評価・⼈⼿評価において⾼い性能を⽰す 2
Introduction l GEC(Grammatical Error Correction)タスクの動向 Ø token-level → phrase-level →
sentence-level l sentence-level: 流暢性を考慮 Ø ⽂脈による単語選択、コロケーション、単語の並び順 など l 流暢性を考慮したモデル:PBMT, neural encoder- decoder models 3
Introduction l encode-decoder の最適化に maximum likelihood estimation(MLE)が⽤いられてきた l MLEの⽋点 Ø
ある時点で間違った単語を予測すると、それ以降の単語 にも影響を与えてしまう 4
Maximum Likelihood Estimation 5 l 各時刻で単語の予測を最適化する l ⽂全体の評価はしない " #
$ % " # $ % " # $ encoder decoder : Y: encoder-decoder model objective
Neural Reinforcement Leaning l 報酬を最⼤化するようにNRLのパラメータを学習→強化学習 6 (ŷ| ; ): 予測単語列の確率
(ŷ, ): 正解(y)に対する予測(ŷ)の報酬 objective
Reward in GEC: GLEU l 原⽂(S), 出⼒(H), 正解(R)からN-gram適合率を計算する l N(A,
B): AとBのN-gramの重複数 l BP(brevity penalty): 出⼒の⻑さ(h)と正解の⻑さ(r)で決まる 7
Experiments データセット 8 モデル
Results l ランダムに200⽂を選択して2⼈のワーカーが評価 l TrueSkill algorithm(Herbrich et al., 2006; Sakaguchi
et al., 2014)を 使って評価スコアを計算 l ⼈⼿評価とGLEUに相関あり 9
Results 10
Conclusions l 強化学習を⽤いたニューラルエンコーダデコーダモデル l MLEの問題である単語レベルの評価に対して、GLEUを⽤い て⽂レベルの最適化に取り組んだ l ⼈⼿評価・⾃動評価において提案⼿法が優れた性能を⽰し た 11
Extra Ø a 12