Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Simple and Effective Paraphrastic Similarity fr...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
katsutan
January 27, 2020
Technology
220
0
Share
Simple and Effective Paraphrastic Similarity from Parallel Translations
文献紹介
https://www.aclweb.org/anthology/P19-1453.pdf
長岡技術科学大学
勝田 哲弘
katsutan
January 27, 2020
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
250
Simple task-specific bilingual word embeddings
katsutan
0
230
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
270
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
230
Improving Word Embeddings Using Kernel PCA
katsutan
0
240
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
340
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
280
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
310
DSGAN: Generative Adversarial Training for Distant Supervision Relation Extraction
katsutan
0
280
Other Decks in Technology
See All in Technology
ブロックチェーン / Blockchain
ks91
PRO
0
110
「コーディング」しない人のための Claude Code 入門 ChatGPT の次の一歩 — 業務に組み込む 育成・共有・自動化
rfdnxbro
2
1.2k
生成 AI × MCP で切り拓く次世代 SRE!自律型運用への挑戦と開発者体験の進化
_awache
0
150
個人の発見を、組織の知恵に 〜生成AI活用を"探索"から"組織の仕組み"へ〜
kintotechdev
2
960
そのPoC、何を検証したつもりでしたか? AIプロダクトの価値検証で陥った落とし穴
techtekt
PRO
0
150
チームで実践する AI-DLC 思考の軌跡を残すチェックポイント設計
belongadmin
0
2.6k
速さだけじゃない! VoidZero ツールが移行先に選ばれる理由
mizdra
PRO
6
750
Mastering Ruby Box
tagomoris
3
150
Building applications in the Gemini API family.
line_developers_tw
PRO
0
1.4k
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
180
ポケモンの型をTypeScriptの型システムで表現してみた
subroh0508
0
320
Djangoユーザが知っ得なPostgreSQL機能 - 設計の選択肢を増やす / Djang-use-PostgreSQL
soudai
PRO
0
180
Featured
See All Featured
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
840
We Are The Robots
honzajavorek
0
240
30 Presentation Tips
portentint
PRO
1
320
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
250
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Test your architecture with Archunit
thirion
1
2.3k
The Language of Interfaces
destraynor
162
27k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
350
The Invisible Side of Design
smashingmag
302
52k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
390
The Curious Case for Waylosing
cassininazir
1
370
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
320
Transcript
Simple and Effective Paraphrastic Similarity from Parallel Translations 長岡技術科学大学 自然言語処理研究室
勝田 哲弘 文献紹介 Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 4602–4608 Florence, Italy, July 28 - August 2, 2019
Abstract ➢言い換え文の埋め込みを学習するためのモデル ➢時間のかかる言い換えコーパスの作成ステップを削除 ➢bitextから直接学習 ➢結果 ➢このモデルは最先端の複雑なモデルよりも優れている ➢高速であり、クロスリンガルタスクに適用できる 2
Introduction ➢これまでの文の類似性 ➢言い換えフレーズのデータセットで学習 ➢大きなバイリンガルコーパスから言い換えデータセット を誘導する ➢本論文 ➢文の埋め込みをbitextで直接学習 ➢高速に文章をエンコードするシンプルなモデル 3
Learning Sentence Embeddings ➢Training ⚫ トレーニングデータ ⚫ それぞれソース言語とターゲット言語の一連の並列文 ペア (
, ) ⚫ ネガティブサンプリング ⚫ の翻訳ではないターゲット文′ をランダムに選択 ⚫ ( , )を( , ′ )よりもマージンδ近づける 4 目的関数 (; ): 各言語のパラメーターを持つ センテンスエンコーダー
Learning Sentence Embeddings ➢Negative Sampling ➢ mega-batching, Wieting and Gimpel(2018)
➢Mが大きいほど困難な例を提供 ➢Mega-batching ➢M個のミニバッチを集約して1つのメガバッチを作成し、 メガバッチから負の例を選択 ➢メガバッチの各ペアに負の例があれば、メガバッチはM 個のミニバッチに分割 5
Learning Sentence Embeddings Encoders ➢SP ➢sentencepiece のサブワードを平均 ➢TRIGRAM ➢文字トライグラムの平均 ➢WORD
➢単語の平均 ➢LSTM-SP ➢Sentencepieceを用いた双方向LSTM 6
Experiments ➢並列データと逆翻訳された並列データの学習 を比較 ➢2012-2016年のSemEval Semantic Textual Similarity (STS) ➢2つのsemantic cross-lingual
tasksでの最良の モデルSPを比較 ➢2017 SemEval STS ➢2018 Building and Using Parallel Corpora (BUCC) 7
Back-Translated Text vs. Parallel Text ➢En-EnはEn-CS(1M) より、 SPを除いて高い相関 ➢同数の英文を用意すれば 同程度の性能
➢En-CS設定でSPは最高の パフォーマンスを発揮
Monolingual and Cross-Lingual Similarity 従来の深層学習モデル を上回る精度
Monolingual and Cross-Lingual Similarity ランダム設定ではTRIGRAMが強い ※語彙の重複がないと精度が低い
Mining Bitext ➢異なる各言語の大規模なコーパスから正しい対訳 ペアを見つける 11
Encoding Speed 12
Does Language Choice Matter? 13
Conclusion ➢bitextを直接使用することにより精度の高い文の埋 め込みを作成 ➢ピボットや逆翻訳などを使用する必要がない ➢言語横断的表現が生成可能 ➢比較可能な従来の方法と比べて圧倒的に高速 14