Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Grammatical Error Correction with Neural Reinfo...
Search
youichiro
June 05, 2018
Technology
0
130
Grammatical Error Correction with Neural Reinforcement Learning
長岡技術科学大学
自然言語処理研究室
文献紹介(2018-06-06)
youichiro
June 05, 2018
Tweet
Share
More Decks by youichiro
See All by youichiro
日本語文法誤り訂正における誤り傾向を考慮した擬似誤り生成
youichiro
0
1.6k
分類モデルを用いた日本語学習者の格助詞誤り訂正
youichiro
0
120
Multi-Agent Dual Learning
youichiro
1
190
Automated Essay Scoring with Discourse-Aware Neural Models
youichiro
0
140
Context is Key- Grammatical Error Detection with Contextual Word Representations
youichiro
1
160
勉強勉強会
youichiro
0
97
Confusionset-guided Pointer Networks for Chinese Spelling Check
youichiro
0
210
A Neural Grammatical Error Correction System Built On Better Pre-training and Sequential Transfer Learning
youichiro
0
190
An Empirical Study of Incorporating Pseudo Data into Grammatical Error Correction
youichiro
0
220
Other Decks in Technology
See All in Technology
OpenShiftでllm-dを動かそう!
jpishikawa
0
130
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
310
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
2
380
ブロックテーマでサイトをリニューアルした話 / 2026-01-31 Kansai WordPress Meetup
torounit
0
470
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
3
210
Frontier Agents (Kiro autonomous agent / AWS Security Agent / AWS DevOps Agent) の紹介
msysh
3
180
Agent Skils
dip_tech
PRO
0
120
小さく始めるBCP ― 多プロダクト環境で始める最初の一歩
kekke_n
1
450
セキュリティについて学ぶ会 / 2026 01 25 Takamatsu WordPress Meetup
rocketmartue
1
310
配列に見る bash と zsh の違い
kazzpapa3
3
160
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
2k
Digitization部 紹介資料
sansan33
PRO
1
6.8k
Featured
See All Featured
New Earth Scene 8
popppiees
1
1.5k
Building an army of robots
kneath
306
46k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
290
Building Applications with DynamoDB
mza
96
6.9k
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
0
2.3k
Between Models and Reality
mayunak
1
190
GitHub's CSS Performance
jonrohan
1032
470k
Leo the Paperboy
mayatellez
4
1.4k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
130
Chasing Engaging Ingredients in Design
codingconduct
0
110
So, you think you're a good person
axbom
PRO
2
1.9k
Transcript
Grammatical Error Correction with Neural Reinforcement Learning Keisuke Sakaguchi, Matta
Post and Benjamin Van Durme Proceedings of the 8th International Joint Conference on Natural Language Processing, pages 366-372, 2017 ⽂献紹介(2018-06-06) ⻑岡技術科学⼤学 ⾃然⾔語処理研究室 ⼩川 耀⼀朗 1
Abstract l 強化学習を⽤いたニューラルエンコーダ・デコーダモデル l ⽂レベルの最適化が可能 l ⾃動評価・⼈⼿評価において⾼い性能を⽰す 2
Introduction l GEC(Grammatical Error Correction)タスクの動向 Ø token-level → phrase-level →
sentence-level l sentence-level: 流暢性を考慮 Ø ⽂脈による単語選択、コロケーション、単語の並び順 など l 流暢性を考慮したモデル:PBMT, neural encoder- decoder models 3
Introduction l encode-decoder の最適化に maximum likelihood estimation(MLE)が⽤いられてきた l MLEの⽋点 Ø
ある時点で間違った単語を予測すると、それ以降の単語 にも影響を与えてしまう 4
Maximum Likelihood Estimation 5 l 各時刻で単語の予測を最適化する l ⽂全体の評価はしない " #
$ % " # $ % " # $ encoder decoder : Y: encoder-decoder model objective
Neural Reinforcement Leaning l 報酬を最⼤化するようにNRLのパラメータを学習→強化学習 6 (ŷ| ; ): 予測単語列の確率
(ŷ, ): 正解(y)に対する予測(ŷ)の報酬 objective
Reward in GEC: GLEU l 原⽂(S), 出⼒(H), 正解(R)からN-gram適合率を計算する l N(A,
B): AとBのN-gramの重複数 l BP(brevity penalty): 出⼒の⻑さ(h)と正解の⻑さ(r)で決まる 7
Experiments データセット 8 モデル
Results l ランダムに200⽂を選択して2⼈のワーカーが評価 l TrueSkill algorithm(Herbrich et al., 2006; Sakaguchi
et al., 2014)を 使って評価スコアを計算 l ⼈⼿評価とGLEUに相関あり 9
Results 10
Conclusions l 強化学習を⽤いたニューラルエンコーダデコーダモデル l MLEの問題である単語レベルの評価に対して、GLEUを⽤い て⽂レベルの最適化に取り組んだ l ⼈⼿評価・⾃動評価において提案⼿法が優れた性能を⽰し た 11
Extra Ø a 12