Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Grammatical Error Correction with Neural Reinfo...
Search
youichiro
June 05, 2018
Technology
130
0
Share
Grammatical Error Correction with Neural Reinforcement Learning
長岡技術科学大学
自然言語処理研究室
文献紹介(2018-06-06)
youichiro
June 05, 2018
More Decks by youichiro
See All by youichiro
日本語文法誤り訂正における誤り傾向を考慮した擬似誤り生成
youichiro
0
1.6k
分類モデルを用いた日本語学習者の格助詞誤り訂正
youichiro
0
130
Multi-Agent Dual Learning
youichiro
1
200
Automated Essay Scoring with Discourse-Aware Neural Models
youichiro
0
140
Context is Key- Grammatical Error Detection with Contextual Word Representations
youichiro
1
160
勉強勉強会
youichiro
0
100
Confusionset-guided Pointer Networks for Chinese Spelling Check
youichiro
0
210
A Neural Grammatical Error Correction System Built On Better Pre-training and Sequential Transfer Learning
youichiro
0
190
An Empirical Study of Incorporating Pseudo Data into Grammatical Error Correction
youichiro
0
230
Other Decks in Technology
See All in Technology
AgentCore Managed Harness を使ってみよう
yakumo
2
300
AIの揺らぎに“コシ”を与える階層化品質設計
ickx
0
200
変化の激しい時代をゴキゲンに生き抜くために 〜ストレスマネジメントのススメ〜
kakehashi
PRO
4
770
ボトムアップの改善の火を灯し続けろ!〜支援現場で学んだ、消えないための3つの打ち手〜 / 20260509 Kazuki Mori
shift_evolve
PRO
2
370
20260428_Product Management Summit_tadokoroyoshiro
tadokoro_yoshiro
15
18k
サービスの信頼性を高めるため、形骸化した「プロダクションミーティング」を立て直すまでの取り組み
stefafafan
1
220
エージェント時代の UIとAPI、CLI戦略
coincheck_recruit
0
120
[Oracle TechNight#99] 生成AI時代のAI/ML入門 ~ AIとオラクルデータベースの関係 (前半)
oracle4engineer
PRO
1
210
ファインディの事業拡大を支える 拡張可能なデータ基盤へのリアーキテクチャ
hiracky16
0
800
[Oracle TechNight#99] 生成AI時代のAI/ML入門 ~ AIとオラクルデータベースの関係 (後半)
oracle4engineer
PRO
2
190
データ定義の混乱と戦う 〜 管理会計と財務会計 〜
wonohe
0
170
AI와 협업하는 조직으로의 여정
arawn
0
580
Featured
See All Featured
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
My Coaching Mixtape
mlcsv
0
110
Rails Girls Zürich Keynote
gr2m
96
14k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.7k
The SEO Collaboration Effect
kristinabergwall1
1
440
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.6k
Between Models and Reality
mayunak
3
280
Designing for Performance
lara
611
70k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Exploring anti-patterns in Rails
aemeredith
3
340
Bash Introduction
62gerente
615
210k
Visualization
eitanlees
150
17k
Transcript
Grammatical Error Correction with Neural Reinforcement Learning Keisuke Sakaguchi, Matta
Post and Benjamin Van Durme Proceedings of the 8th International Joint Conference on Natural Language Processing, pages 366-372, 2017 ⽂献紹介(2018-06-06) ⻑岡技術科学⼤学 ⾃然⾔語処理研究室 ⼩川 耀⼀朗 1
Abstract l 強化学習を⽤いたニューラルエンコーダ・デコーダモデル l ⽂レベルの最適化が可能 l ⾃動評価・⼈⼿評価において⾼い性能を⽰す 2
Introduction l GEC(Grammatical Error Correction)タスクの動向 Ø token-level → phrase-level →
sentence-level l sentence-level: 流暢性を考慮 Ø ⽂脈による単語選択、コロケーション、単語の並び順 など l 流暢性を考慮したモデル:PBMT, neural encoder- decoder models 3
Introduction l encode-decoder の最適化に maximum likelihood estimation(MLE)が⽤いられてきた l MLEの⽋点 Ø
ある時点で間違った単語を予測すると、それ以降の単語 にも影響を与えてしまう 4
Maximum Likelihood Estimation 5 l 各時刻で単語の予測を最適化する l ⽂全体の評価はしない " #
$ % " # $ % " # $ encoder decoder : Y: encoder-decoder model objective
Neural Reinforcement Leaning l 報酬を最⼤化するようにNRLのパラメータを学習→強化学習 6 (ŷ| ; ): 予測単語列の確率
(ŷ, ): 正解(y)に対する予測(ŷ)の報酬 objective
Reward in GEC: GLEU l 原⽂(S), 出⼒(H), 正解(R)からN-gram適合率を計算する l N(A,
B): AとBのN-gramの重複数 l BP(brevity penalty): 出⼒の⻑さ(h)と正解の⻑さ(r)で決まる 7
Experiments データセット 8 モデル
Results l ランダムに200⽂を選択して2⼈のワーカーが評価 l TrueSkill algorithm(Herbrich et al., 2006; Sakaguchi
et al., 2014)を 使って評価スコアを計算 l ⼈⼿評価とGLEUに相関あり 9
Results 10
Conclusions l 強化学習を⽤いたニューラルエンコーダデコーダモデル l MLEの問題である単語レベルの評価に対して、GLEUを⽤い て⽂レベルの最適化に取り組んだ l ⼈⼿評価・⾃動評価において提案⼿法が優れた性能を⽰し た 11
Extra Ø a 12