Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介: Bag-of-Words as Target for Neural Machine...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yumeto Inaoka
January 22, 2019
Research
210
0
Share
文献紹介: Bag-of-Words as Target for Neural Machine Translation
2019/1/22の文献紹介で発表
Yumeto Inaoka
January 22, 2019
More Decks by Yumeto Inaoka
See All by Yumeto Inaoka
文献紹介: Quantity doesn’t buy quality syntax with neural language models
yumeto
1
210
文献紹介: Open Domain Web Keyphrase Extraction Beyond Language Modeling
yumeto
0
280
文献紹介: Self-Supervised_Neural_Machine_Translation
yumeto
0
190
文献紹介: Comparing and Developing Tools to Measure the Readability of Domain-Specific Texts
yumeto
0
210
文献紹介: PAWS: Paraphrase Adversaries from Word Scrambling
yumeto
0
200
文献紹介: Beyond BLEU: Training Neural Machine Translation with Semantic Similarity
yumeto
0
320
文献紹介: EditNTS: An Neural Programmer-Interpreter Model for Sentence Simplification through Explicit Editing
yumeto
0
410
文献紹介: Decomposable Neural Paraphrase Generation
yumeto
0
250
文献紹介: Analyzing the Limitations of Cross-lingual Word Embedding Mappings
yumeto
0
270
Other Decks in Research
See All in Research
通時的な類似度行列に基づく単語の意味変化の分析
rudorudo11
0
310
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
1.3k
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
1.1k
計算情報学研究室(数理情報学第7研究室)2026
tomohirokoana
0
510
正規分布と最適化について
koide3
1
240
第12回人と環境にやさしい交通をめざす全国大会/熊本都市圏「車1割削減、渋滞半減、公共交通2倍」をめざして
trafficbrain
0
110
PGDM: Physically Guided Diffusion Model for L Downscaling
satai
2
240
SoftMatcha 2: 1兆語規模コーパスの超高速かつ柔らかい検索
e869120_sub
6
3.4k
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
810
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
340
ブレグマン距離最小化に基づくリース表現量推定:バイアス除去学習の統一理論
masakat0
0
270
羽田新ルート運用6年の検証
1manken
0
160
Featured
See All Featured
How Software Deployment tools have changed in the past 20 years
geshan
0
34k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
We Are The Robots
honzajavorek
0
240
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
200
Game over? The fight for quality and originality in the time of robots
wayneb77
1
190
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
The Cult of Friendly URLs
andyhume
79
6.9k
Transcript
1 Bag-of-Words as Target for Neural Machine Translation 文献紹介 2019/1/22
長岡技術科学大学 自然言語処理研究室 稲岡 夢人
Literature • Bag-of-Words as Target for Neural Machine Translation •
Shuming Ma, Xu SUN, Yizhong Wang, Junyang Lin • Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), pages 332-338, 2018. 2
Abstract 翻訳において正解はひとつじゃない 既存のNMTではひとつのみを正解として使用 → 他の正解は誤りとして学習される 正解同士は似たBag-of-Words (BoW)
を共有する → BoWによって正解とそれ以外を区別できる 学習セットにない正解を考慮するためにBoWを利用 → 中国語-英語の翻訳において優位性を確認 3
Introduction NMTは首尾一貫の妥当な翻訳の生成ができる 現在のNeural Machine Translation (NMT)の 多くはSequence-to-Sequence モデル(Seq2Seq)に
基づいている 4
Seq2Seq (Overview) 5 私 は 元気だ <BOS> I am fine
<EOS> 入力文 出力文 Encoder Decoder
Seq2Seq (Encoder) 6 私 は 元気だ One-hot vector Embedding layer
Recurrent layer 入力文
Seq2Seq (Decoder) 7 I <BOS> I am fine am fine
<EOS> One-hot vector Embedding layer Recurrent layer One-hot vector Output layer 出力文
Introduction NMTではひとつの正解のみを 学習に用いる 他の正解は誤った翻訳と学習 → 悪影響を与える可能性 8
Introduction 正しい翻訳は似たBoWを共有 → 正しい翻訳と誤った翻訳は BoWで区別できる 文とBoWの両方を対象とする 手法を提案 →
T.2よりT.1を優遇 9
Bag-of-Words Generation マルチラベル分類問題のようにBoWを生成 Decoderの出力である単語レベルのスコアベクトル を 合計して、文レベルのスコアベクトルを得る 文レベルのスコアベクトルは、文中の任意の位置に
対応する単語が出現する確率を表す 10
Notation データセットに含まれるサンプル数:N i番目のサンプル:(, ) (x: source, y: target)
= 1 , 2 , … , = 1 , 2 , … , = 1 , 2 , … , はのBoWを表す 11
Bag-of-Words Generation 12 = softmax = �
Targets and Loss Function 文の翻訳とBoWの生成でそれぞれ損失関数(1 , 2 )を定義
重み で2つの損失を足し合わせる() (𝑖𝑖 : epoch , k, : fixed-value) 1 = − � =1 log l2 = − � =1 log = 1 + 2 = min(, + 𝛼𝛼) 13 𝑖𝑖
Experiments LDCコーパス(1.25M)で学習、NIST翻訳タスクで評価 語彙サイズを英中それぞれ5万語に設定 BLEUで評価 14
Results 15 4.55 BLEU points↑
Results 16 4.55 BLEU points↑
Results 17
Conclusions 正解訳とBoWの両方を考慮する手法を提案 提案手法が強力なベースラインに対して優位である結果 Morphologically-rich language*や低資源言語において どのように適用するかについて今後の課題とする *
文法的関係が相対位置や助詞ではなく単語の変化で 決まるような言語 18