Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Grammatical Error Correction with Neural Reinfo...
Search
youichiro
June 05, 2018
Technology
0
120
Grammatical Error Correction with Neural Reinforcement Learning
長岡技術科学大学
自然言語処理研究室
文献紹介(2018-06-06)
youichiro
June 05, 2018
Tweet
Share
More Decks by youichiro
See All by youichiro
日本語文法誤り訂正における誤り傾向を考慮した擬似誤り生成
youichiro
0
1.5k
分類モデルを用いた日本語学習者の格助詞誤り訂正
youichiro
0
81
Multi-Agent Dual Learning
youichiro
1
150
Automated Essay Scoring with Discourse-Aware Neural Models
youichiro
0
100
Context is Key- Grammatical Error Detection with Contextual Word Representations
youichiro
1
120
勉強勉強会
youichiro
0
80
Confusionset-guided Pointer Networks for Chinese Spelling Check
youichiro
0
170
A Neural Grammatical Error Correction System Built On Better Pre-training and Sequential Transfer Learning
youichiro
0
140
An Empirical Study of Incorporating Pseudo Data into Grammatical Error Correction
youichiro
0
190
Other Decks in Technology
See All in Technology
数百台のオンプレミスのサーバーをEKSに移行した話
yukiteraoka
0
680
ソフトウェア開発現代史: なぜ日本のソフトウェア開発は「滝」なのか?製造業の成功体験とのギャップ #jassttokyo
takabow
2
1.6k
コード品質向上で得られる効果と実践的取り組み
ham0215
2
200
大規模サービスにおける カスケード障害
takumiogawa
2
260
モンテカルロ木探索のパフォーマンスを予測する Kaggleコンペ解説 〜生成AIによる未知のゲーム生成〜
rist
4
1.1k
スケールアップ企業のQA組織のバリューを最大限に引き出すための取り組み
tarappo
4
960
グループポリシー再確認
murachiakira
0
170
DevOps文化を育むQA 〜カルチャーバブルを生み出す戦略〜 / 20250317 Atsushi Funahashi
shift_evolve
1
110
AIエージェントキャッチアップと論文リサーチ
os1ma
6
1.2k
移行できそうでやりきれなかった 10年超えのシステムを葬るための戦略
ryu955
2
490
技術好きなエンジニアが _リーダーへの進化_ によって得たものと失ったもの / The Gains and Losses of a Tech-Enthusiast Engineer’s “Evolution into Leadership”
kaminashi
0
210
Cline、めっちゃ便利、お金が飛ぶ💸
iwamot
19
19k
Featured
See All Featured
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
120k
The World Runs on Bad Software
bkeepers
PRO
67
11k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.2k
Gamification - CAS2011
davidbonilla
81
5.2k
Making the Leap to Tech Lead
cromwellryan
133
9.2k
Reflections from 52 weeks, 52 projects
jeffersonlam
349
20k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.7k
Optimizing for Happiness
mojombo
377
70k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
40
2k
KATA
mclloyd
29
14k
Six Lessons from altMBA
skipperchong
27
3.7k
BBQ
matthewcrist
88
9.5k
Transcript
Grammatical Error Correction with Neural Reinforcement Learning Keisuke Sakaguchi, Matta
Post and Benjamin Van Durme Proceedings of the 8th International Joint Conference on Natural Language Processing, pages 366-372, 2017 ⽂献紹介(2018-06-06) ⻑岡技術科学⼤学 ⾃然⾔語処理研究室 ⼩川 耀⼀朗 1
Abstract l 強化学習を⽤いたニューラルエンコーダ・デコーダモデル l ⽂レベルの最適化が可能 l ⾃動評価・⼈⼿評価において⾼い性能を⽰す 2
Introduction l GEC(Grammatical Error Correction)タスクの動向 Ø token-level → phrase-level →
sentence-level l sentence-level: 流暢性を考慮 Ø ⽂脈による単語選択、コロケーション、単語の並び順 など l 流暢性を考慮したモデル:PBMT, neural encoder- decoder models 3
Introduction l encode-decoder の最適化に maximum likelihood estimation(MLE)が⽤いられてきた l MLEの⽋点 Ø
ある時点で間違った単語を予測すると、それ以降の単語 にも影響を与えてしまう 4
Maximum Likelihood Estimation 5 l 各時刻で単語の予測を最適化する l ⽂全体の評価はしない " #
$ % " # $ % " # $ encoder decoder : Y: encoder-decoder model objective
Neural Reinforcement Leaning l 報酬を最⼤化するようにNRLのパラメータを学習→強化学習 6 (ŷ| ; ): 予測単語列の確率
(ŷ, ): 正解(y)に対する予測(ŷ)の報酬 objective
Reward in GEC: GLEU l 原⽂(S), 出⼒(H), 正解(R)からN-gram適合率を計算する l N(A,
B): AとBのN-gramの重複数 l BP(brevity penalty): 出⼒の⻑さ(h)と正解の⻑さ(r)で決まる 7
Experiments データセット 8 モデル
Results l ランダムに200⽂を選択して2⼈のワーカーが評価 l TrueSkill algorithm(Herbrich et al., 2006; Sakaguchi
et al., 2014)を 使って評価スコアを計算 l ⼈⼿評価とGLEUに相関あり 9
Results 10
Conclusions l 強化学習を⽤いたニューラルエンコーダデコーダモデル l MLEの問題である単語レベルの評価に対して、GLEUを⽤い て⽂レベルの最適化に取り組んだ l ⼈⼿評価・⾃動評価において提案⼿法が優れた性能を⽰し た 11
Extra Ø a 12