Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介: Controlling Politeness in Neural Machine ...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yumeto Inaoka
July 18, 2017
Technology
140
0
Share
文献紹介: Controlling Politeness in Neural Machine Translation via Side Constraints
2017/07/18の文献紹介で発表
Yumeto Inaoka
July 18, 2017
More Decks by Yumeto Inaoka
See All by Yumeto Inaoka
文献紹介: Quantity doesn’t buy quality syntax with neural language models
yumeto
1
210
文献紹介: Open Domain Web Keyphrase Extraction Beyond Language Modeling
yumeto
0
280
文献紹介: Self-Supervised_Neural_Machine_Translation
yumeto
0
190
文献紹介: Comparing and Developing Tools to Measure the Readability of Domain-Specific Texts
yumeto
0
210
文献紹介: PAWS: Paraphrase Adversaries from Word Scrambling
yumeto
0
200
文献紹介: Beyond BLEU: Training Neural Machine Translation with Semantic Similarity
yumeto
0
320
文献紹介: EditNTS: An Neural Programmer-Interpreter Model for Sentence Simplification through Explicit Editing
yumeto
0
410
文献紹介: Decomposable Neural Paraphrase Generation
yumeto
0
250
文献紹介: Analyzing the Limitations of Cross-lingual Word Embedding Mappings
yumeto
0
270
Other Decks in Technology
See All in Technology
GoとSIMDとWasmの今。
askua
3
510
先取りMaven4 ~16年ぶりのメジャーアップデート、その進化とは?~
ogiwarat
0
140
「速く作る」から「正しく作る」へ ─ 生成AI時代の開発フロー改革の ロードマップと実行 ─
starfish719
0
7.5k
Chart.js が簡単に使えるようになっていたので OGP 画像生成に使った話
kamekyame
0
160
Oracle Cloud Infrastructure IaaS 新機能アップデート 2026/3 - 2026/5
oracle4engineer
PRO
1
190
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
410
SIer20年! 培ったスキルがスタートアップで輝く時
shucho0103
0
230
新規ゲーム開発におけるAI駆動開発のリアル
202409e2
0
2.5k
そのPoC、何を検証したつもりでしたか? AIプロダクトの価値検証で陥った落とし穴
techtekt
PRO
0
150
DevOps Agentで始めるAWS運用 〜フロンティアエージェントが変える運用の現場〜
nyankotaro
1
210
PHP と TypeScript の型システム比較:AI 時代の「型」は誰のためにあるのか? #frontend_phpcon_do / frontend_phpcon_do_2026
shogogg
1
250
BigQuery の Cross-cloud Lakehouse への歩み
phaya72
2
550
Featured
See All Featured
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
360
The Mindset for Success: Future Career Progression
greggifford
PRO
0
350
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
380
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Embracing the Ebb and Flow
colly
88
5.1k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
400
Rails Girls Zürich Keynote
gr2m
96
14k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.2k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
160
Transcript
Controlling Politeness in Neural Machine Translation via Side Constraints Rico
Sennrich, Barry Haddow, Alexandra Birch Proceedings of NAACL-HLT 2016, pages 35–40 1 文献紹介(2017/07/18) 自然言語処理研究室 稲岡 夢人
概要 • 敬語のない元言語の翻訳で出力の敬語制御 • 敬語の制御にSide Constraintsを使用 • 英語→ドイツ語において性能が向上 2
NMT with Side Constraints • ニューラルネットに丁寧さを示す追加の 入力機能を与える • テスト時はユーザが丁寧さを入力 •
入力文の最後にトークンとして Side Constraintsを追加 → Attention-based encoder-decoder モデルであればSide Constraintsに 注意を払うことを学習できる 3
訓練セットへの自動注釈 • 事前に訓練セットに注釈をつける • 注釈は文レベルで付ける → ソースとターゲットで単語レベルの 対応を持たないため 4
訓練セットへの自動注釈 • ParZu(Sennrich et al., 2013)を用いて ルールに基づいて形態論的な注釈をつける • 命令形の動詞を含む文はinformalに分類 5
実験 • 訓練コーパス:OpenSubtitles (映画字幕丁 寧な文の対が48万 丁寧でない文の対が109万 • Groundhogを使用してAttention-based encoder-decoder NMTシステムを訓練
• Side Constraintsに過度な依存をしない ように半分の確率でラベル付けした 6
結果 • informalに限定した翻訳の98%はinformal または中立 • 丁寧な文に限定した翻訳の96%は 丁寧または中立 7
結果 • 参照文をもとにSide Constraintsを与えるオ ラクル実験ではBLEUが3.2改善 8
結果 • Side ConstraintsはNMTにオーバライド されることがある → 弱い制約なため 9
結果 • ランダムサンプルにおいても同様に Side Constraintsが有効である 10
結論 • 丁寧さの注釈を訓練の追加入力として統合し てNMTの敬語生成を制御できる • 丁寧さがユーザに指定される前提であるが 将来はソーステキストから自動的に予測する ことを目指す • 本稿では丁寧さの制御に焦点を当てている
が、幅広い現象にSide Constraintsを適用 できる可能性がある 11