Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
An Effective Approach to Unsupervised Machine T...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Ryusuke_Tanaka
November 21, 2019
Technology
0
120
An Effective Approach to Unsupervised Machine Translationの紹介
An Effective Approach to Unsupervised Machine Translationの紹介です。
教師なし翻訳に関するお話です。
Ryusuke_Tanaka
November 21, 2019
Tweet
Share
More Decks by Ryusuke_Tanaka
See All by Ryusuke_Tanaka
医師向けQAサイトのための推薦システム開発
ryusuketa
1
1.7k
Universal Decompositional Semantics on Universal Dependencies
ryusuketa
0
88
Learning Dual Retrieval Module for Semi-supervised Relation Extractionの紹介
ryusuketa
0
92
動画視聴を整数倍(最大値)で_効率化するchrome extension作った
ryusuketa
0
86
双曲空間への単語埋め込みと QAサービスでの自然言語処理を 用いた推薦システムについて
ryusuketa
0
610
Other Decks in Technology
See All in Technology
ナレッジワークのご紹介(第88回情報処理学会 )
kworkdev
PRO
0
190
[JAWSDAYS2026][D8]その起票、愛が足りてますか?AWSサポートを味方につける、技術的「ラブレター」の書き方
hirosys_
3
120
事例に見るスマートファクトリーへの道筋〜工場データをAI Readyにする実践ステップ〜
hamadakoji
1
290
今のWordPress の制作手法ってなにがあんねん?(改) / What’s the Deal with WordPress Development These Days?
tbshiki
0
310
類似画像検索モデルの開発ノウハウ
lycorptech_jp
PRO
5
1.1k
Claude Codeの進化と各機能の活かし方
oikon48
22
12k
ランサムウエア対策してますか?やられた時の対策は本当にできてますか?AWSでのリスク分析と対応フローの泥臭いお話。
hootaki
0
110
製造業ドメインにおける LLMプロダクト構築: 複雑な文脈へのアプローチ
caddi_eng
1
560
越境する組織づくり ─ 多様性を前提にしたチームビルディングとリードの実践知
kido_engineer
2
190
8万デプロイ
iwamot
PRO
2
230
Google系サービスで文字起こしから勝手にカレンダーを埋めるエージェントを作った話
risatube
0
150
マルチプレーンGPUネットワークを実現するシャッフルアーキテクチャの整理と考察
markunet
2
240
Featured
See All Featured
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
The Cult of Friendly URLs
andyhume
79
6.8k
Tell your own story through comics
letsgokoyo
1
840
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
110
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
300
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
230
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
69
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.1k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
1.9k
Transcript
An Effective Approach to Unsupervised Machine Translation
None
?/= 8E 45": 3'209 40G0AIoT< :+;F<%$6 B@-(,F.
!)#7*&>12FM2 D1 CD!)#7ML
Unsupervised Machine Translation • 87=@16Statistical Machine Translation (SMT) Neural Machine
Translation (NMT))(95/&%$ ◦ .@.0:2?>! • -B"*< .@;3,A=@4+ ◦ Word translation without parallel data.[Alexis 2017], ◦ Learning bilingual word embeddings with (almost) no bilingual data [Artetxe 2017] • !#'5/ 87=@ NMT>!4+ ◦ UNSUPERVISED MACHINE TRANSLATION USING MONOLINGUAL CORPORA ONLY [Lample2018] ◦ Unsupervised statistical machine translation [Artetxe 2018]
Supervised Machine Translation NMT Back-translation !
#"BLEU http://deeplearning.hatenablog.com/entry/back_translation#f-726c04a7
!! • D8?8B;=/@[Alexis 2017] ◦ /@*;="%$#1: ◦ ;=B/@)3& A404 6
- 5.+=A'9C9 7> ◦ +=A( , +=2<EF
SMT https://www.nhk.or.jp/strl/publica/rd/rd168/pdf/P14-25.pdf
' 1. % $ 2. &! 3. SMT$
" 4. " refinement 5. NMT(#
&9 3+ • bi-gram embedding+A8: #6>$<[Artetxe 2018] • :
100=0/ softmax &952"* (e,f8: 4 :, τ1( ?.',%!7 ) ;- …@@
2<0K,A • 3N*6 5/2<0KPO • ex. “Sunday Telegraph”
→ “The Times of London” • =H. %'#& $"&MQ4 R(8-C WaveNet:1D+@9> IF !) 2<G@7JB; LS 7JE?/ T
Unsupervised SMT • Back-translation.CE/;> ◦ DF%"&*8L @3 DFB<+4DF%"&.C •
9H7Cycle GAN !#K65= ◦ -:02I ?HA M 1 : DF'! : ,G(#'$)'! : DF7J'!
+% • '$ SMT+% .0 .0 (), +% • SMT+%
.0!/1-*&# ()2"
NMT$ • "SMT$ %# NMT$ • % NMT#
: SMT%! : NMT%!
WMT2014 seq2seq
…