Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:deepQuest: A Framework for Neural-based Qu...
Search
Taichi Aida
May 04, 2019
Technology
130
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
文献紹介:deepQuest: A Framework for Neural-based Quality Estimation
2019年5月文献紹介
Taichi Aida
May 04, 2019
More Decks by Taichi Aida
See All by Taichi Aida
意味を表すベクトル表現を用いたテキスト分析
a1da4
0
140
スウェーデン滞在報告
a1da4
0
31
PhD Defence: Considering Temporal and Contextual Information for Lexical Semantic Change Detection
a1da4
1
300
文献紹介:A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications
a1da4
1
400
YANS2024:目指せ国際会議!「ネットワーキングの極意(国際会議編)」
a1da4
0
330
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
450
新入生向けチュートリアル:文献のサーベイv2
a1da4
18
12k
文献紹介:Isotropic Representation Can Improve Zero-Shot Cross-Lingual Transfer on Multilingual Language Models
a1da4
0
240
文献紹介:WhitenedCSE: Whitening-based Contrastive Learning of Sentence Embeddings
a1da4
1
390
Other Decks in Technology
See All in Technology
NAB Show 2026 動画技術関連レポート / NAB Show 2026 Report
cyberagentdevelopers
PRO
0
120
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
200
TypeScript Compiler APIとPHP-Parserを活用し、TypeScriptとPHPで型を共有する
shuta13
0
370
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
190
[モダンアプリ勉強会]今更聞けないGit/GitHub入門
tsukuboshi
0
310
Databricks における 生成AIガバナンスの実践
taka_aki
1
360
Microsoft Build Keynoteふりかえり
tomokusaba
0
110
もりもり新機能を一挙紹介! AgentCoreに入門して、AWS上にAIエージェントを構築しよう
minorun365
PRO
6
860
作って終わりにしない タイミーのセマンティックレイヤー育成の現在地
chanyou0311
1
1.1k
Platform engineering for developers, architects & the rest of us (AI agents)
danielbryantuk
0
190
Agentic ERPをどう設計するか ー 受発注エージェントを動かす、現場の知見と設計思想ー
recerqainc
1
1.9k
AI Testing Talks: Challenges of Applying AI in Software Testing: From Hype to Practical Use
exactpro
PRO
1
140
Featured
See All Featured
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
200
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
400
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1.6k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
170
Writing Fast Ruby
sferik
630
63k
WCS-LA-2024
lcolladotor
0
620
Leo the Paperboy
mayatellez
7
1.8k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
850
Scaling GitHub
holman
464
140k
Transcript
⽂献紹介 (2019/05/07) deepQuest: A Framework for Neural-based Quality Estimation 相⽥
太⼀ ⻑岡技術科学⼤学 ⾃然⾔語処理研究室
Literature • Author • Conference 2
Abstract • Quality Estimation (QE)というShared task • ニューラルの⼿法により、性能が向上してきた • しかし、既存の⼿法はどれも単語や⽂単位
• state-of-the-artのモデル POSTECH (Kim et al., 2017)も莫⼤ な事前学習を要する • ⽂単位と⽂書単位の2つの軽量な⼿法を提案 3
Introduction • Quality Estimation (QE)というShared task • 参照翻訳なしで品質を予測 • 品質がラベル付けされたデータで評価
• 従来⼿法(ニューラル) • 単語、句、⽂単位でのQE 以下2つのいずれかを要する • 莫⼤な事前学習 • 特徴量エンジニアリング • 少ないコストで同等かそれ以上の結果 • SMTとNMTの両⽅で実験(初) 4
Existing method: POSTECH • Predictor • encoder-decoder RNN • ⽂脈表現に基づいて単語を予測
• ⼤規模なデータと計算リソースが必要 • Estimator • bidirectional RNN • Predictorからの表現に基づき、 単語、フレーズ、⽂ベースで 予測した品質スコアを⽣成 5
• POSTECH (Kim et al., 2017)は複雑なアーキテクチャ・リソース集約型だが、提 案⼿法は軽量でシンプル・⼤規模な事前訓練なし Proposal method: BI-RNN
6 ①Sentence level ②Document level
Proposal method: BI-RNN ①Sentence level • SourceとMTのencoderそれぞれ独⽴ • 順⽅向と逆⽅向で単語ごとに隠れ状態を計算 •
Attentionで正規化した重みを計算 • ⽂ベクトルは上の2つの積の総和になる 7
Proposal method: BI-RNN ②Document level • ×Sentence levelでのscoreの集合 • ⽂書内でどの⽂が重要かを考慮すべき
→Attention • Attentionの式はSentence levelの時と同じ 8
Evaluation ~Sentence level~ • Datasets • English-German(EN-DE) • IT domain
• 28,000 sentences • English-Latvian(EN-LV) • Life science domain • 18,768 sentences • 以下のように分ける • Dev: 1,000 sentences • Test: 2,000 sentences • Train: 残り 9
Evaluation ~Sentence level~ • Baseline: QuEst++ (Specia et al., 2015)
• 既存⼿法:POSTECH 以下のデータでpredictorの訓練 • Europarl corpus (Koehn, 2005) • 2,000,000 sentences • EN-DE • Parallel data of the WMT 2017 News translation task • 2,000,000 sentences • EN-LV • 提案⼿法:BI-RNN (Sentence level) 10
Result ~Sentence level~ EN-DE • SMT、NMT共にBaselineを上回り、訓練 後のPOSTECHに迫る結果 EN-LV • SMTではBaselineを上回り、訓練後の
POSTECHに迫る • NMTではBaselineが⾼い 11
Evaluation ~Document level~ • Datasets WMT 2008-2017 のNews task (ニュース⽂書の翻訳結果)
• German-English(DE-EN) • 14,640 documents • English-Spanish(EN-ES) • 6,733 documents • English-French(EN-FR) • 11,537 documents • English-Russian(EN-RU) • 6,996 documents • 各システムが提出した提出物の フルセット(ALL) • 各年の最⾼性能と最低性能の システムの提出物(FILT) 12 筆者らの直感: 「極端な品質レベルを考慮すれば、データも ⼩さくなり、区別しやすくなるのでは?」
Evaluation ~Document level~ • # docs: ⽂書数 • ALLは、FILTと⽂書数が同じ数になるようにラ ンダムで抽出
• FILTはALLに含まれるため、devとtestは固定 • av # sent: 1⽂書に含まれる⽂の数の平均 • BLEU: ⽂書レベルのBLEUの平均 • wBLEU: ⽂書レベルの重み付きBLEU平均 • TBLEU: ⽂書単位のTF-IDFにより重み付 けされたBLEUの平均 TBLEU& = ∑)*+ , TFIDF)BLEU) ∑)*+ , ()) 13
Evaluation ~Document level~ • Baseline: QuEst++ (Specia et al., 2015)
• SVR: Support Vector Regression (SVMを回帰に応⽤したもの) で⽂書レベルのQEシステムを学習 • 既存⼿法:POSTECH それぞれ以下のデータで事前訓練 • Europarl corpus • 2,000,000 sentences • EN-DE • News Commentary • 2,000,000 sentences • EN-FR • 提案⼿法:BI-RNN (Document level) 14
Result ~Document level~ • Baseline • 提案⼿法がTBLEUと強い相関 • Attentionはなくても良さそう •
既存⼿法、提案⼿法 15 Last: Attentionなし Att: Attentionあり
Result ~Document level~ • 提案⼿法のみ • EN-RUでの結果が低い→DE-ENとともに、予測が難しい⾔語? 16 Last: Attentionなし
Att: Attentionあり
Conclusion • ニューラルベースの⽂、⽂書単位の品質予測⼿法を提案 • 既存のstate-of-the-art⼿法であるPOSTECHに対し、 • ⽂単位では迫る結果 • ⽂書単位では上回る結果 •
訓練時間は40倍早い となった。 • ソースコードは以下 https://github.com/sheffieldnlp/deepQuest 17