Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介: Controlling Politeness in Neural Machine ...
Search
Yumeto Inaoka
July 18, 2017
Technology
0
130
文献紹介: Controlling Politeness in Neural Machine Translation via Side Constraints
2017/07/18の文献紹介で発表
Yumeto Inaoka
July 18, 2017
Tweet
Share
More Decks by Yumeto Inaoka
See All by Yumeto Inaoka
文献紹介: Quantity doesn’t buy quality syntax with neural language models
yumeto
1
200
文献紹介: Open Domain Web Keyphrase Extraction Beyond Language Modeling
yumeto
0
250
文献紹介: Self-Supervised_Neural_Machine_Translation
yumeto
0
170
文献紹介: Comparing and Developing Tools to Measure the Readability of Domain-Specific Texts
yumeto
0
180
文献紹介: PAWS: Paraphrase Adversaries from Word Scrambling
yumeto
0
170
文献紹介: Beyond BLEU: Training Neural Machine Translation with Semantic Similarity
yumeto
0
290
文献紹介: EditNTS: An Neural Programmer-Interpreter Model for Sentence Simplification through Explicit Editing
yumeto
0
360
文献紹介: Decomposable Neural Paraphrase Generation
yumeto
0
240
文献紹介: Analyzing the Limitations of Cross-lingual Word Embedding Mappings
yumeto
0
240
Other Decks in Technology
See All in Technology
New Relic 1 年生の振り返りと Cloud Cost Intelligence について #NRUG
play_inc
0
220
20251222_サンフランシスコサバイバル術
ponponmikankan
2
140
通勤手当申請チェックエージェント開発のリアル
whisaiyo
3
440
ExpoのインダストリーブースでみたAWSが見せる製造業の未来
hamadakoji
0
190
20251203_AIxIoTビジネス共創ラボ_第4回勉強会_BP山崎.pdf
iotcomjpadmin
0
130
NIKKEI Tech Talk #41: セキュア・バイ・デザインからクラウド管理を考える
sekido
PRO
0
200
ソフトウェアエンジニアとAIエンジニアの役割分担についてのある事例
kworkdev
PRO
0
210
シニアソフトウェアエンジニアになるためには
kworkdev
PRO
3
270
日本の AI 開発と世界の潮流 / GenAI Development in Japan
hariby
1
360
Authlete で実装する MCP OAuth 認可サーバー #CIMD の実装を添えて
watahani
0
160
AI との良い付き合い方を僕らは誰も知らない
asei
0
240
ハッカソンから社内プロダクトへ AIエージェント ko☆shi 開発で学んだ4つの重要要素
leveragestech
0
110
Featured
See All Featured
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
32
Faster Mobile Websites
deanohume
310
31k
How to Ace a Technical Interview
jacobian
281
24k
How to make the Groovebox
asonas
2
1.8k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Amusing Abliteration
ianozsvald
0
69
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
0
250
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
1k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
65
35k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
170
Chasing Engaging Ingredients in Design
codingconduct
0
84
Transcript
Controlling Politeness in Neural Machine Translation via Side Constraints Rico
Sennrich, Barry Haddow, Alexandra Birch Proceedings of NAACL-HLT 2016, pages 35–40 1 文献紹介(2017/07/18) 自然言語処理研究室 稲岡 夢人
概要 • 敬語のない元言語の翻訳で出力の敬語制御 • 敬語の制御にSide Constraintsを使用 • 英語→ドイツ語において性能が向上 2
NMT with Side Constraints • ニューラルネットに丁寧さを示す追加の 入力機能を与える • テスト時はユーザが丁寧さを入力 •
入力文の最後にトークンとして Side Constraintsを追加 → Attention-based encoder-decoder モデルであればSide Constraintsに 注意を払うことを学習できる 3
訓練セットへの自動注釈 • 事前に訓練セットに注釈をつける • 注釈は文レベルで付ける → ソースとターゲットで単語レベルの 対応を持たないため 4
訓練セットへの自動注釈 • ParZu(Sennrich et al., 2013)を用いて ルールに基づいて形態論的な注釈をつける • 命令形の動詞を含む文はinformalに分類 5
実験 • 訓練コーパス:OpenSubtitles (映画字幕丁 寧な文の対が48万 丁寧でない文の対が109万 • Groundhogを使用してAttention-based encoder-decoder NMTシステムを訓練
• Side Constraintsに過度な依存をしない ように半分の確率でラベル付けした 6
結果 • informalに限定した翻訳の98%はinformal または中立 • 丁寧な文に限定した翻訳の96%は 丁寧または中立 7
結果 • 参照文をもとにSide Constraintsを与えるオ ラクル実験ではBLEUが3.2改善 8
結果 • Side ConstraintsはNMTにオーバライド されることがある → 弱い制約なため 9
結果 • ランダムサンプルにおいても同様に Side Constraintsが有効である 10
結論 • 丁寧さの注釈を訓練の追加入力として統合し てNMTの敬語生成を制御できる • 丁寧さがユーザに指定される前提であるが 将来はソーステキストから自動的に予測する ことを目指す • 本稿では丁寧さの制御に焦点を当てている
が、幅広い現象にSide Constraintsを適用 できる可能性がある 11