Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:参照訳を必要としない単語分散表現による異言語間類似度を用いた訳文の自動評価
Search
Taichi Aida
June 12, 2019
Technology
0
150
文献紹介:参照訳を必要としない単語分散表現による異言語間類似度を用いた訳文の自動評価
Taichi Aida
June 12, 2019
Tweet
Share
More Decks by Taichi Aida
See All by Taichi Aida
意味を表すベクトル表現を用いたテキスト分析
a1da4
0
66
PhD Defence: Considering Temporal and Contextual Information for Lexical Semantic Change Detection
a1da4
1
240
文献紹介:A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications
a1da4
1
360
YANS2024:目指せ国際会議!「ネットワーキングの極意(国際会議編)」
a1da4
0
280
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
400
新入生向けチュートリアル:文献のサーベイv2
a1da4
16
11k
文献紹介:Isotropic Representation Can Improve Zero-Shot Cross-Lingual Transfer on Multilingual Language Models
a1da4
0
200
文献紹介:WhitenedCSE: Whitening-based Contrastive Learning of Sentence Embeddings
a1da4
1
310
文献紹介:On the Transformation of Latent Space in Fine-Tuned NLP Models
a1da4
0
120
Other Decks in Technology
See All in Technology
Gemini でコードレビュー知見を見える化
zozotech
PRO
1
250
Databricks向けJupyter Kernelでデータサイエンティストの開発環境をAI-Readyにする / Data+AI World Tour Tokyo After Party
genda
1
110
学習データって増やせばいいんですか?
ftakahashi
2
320
AI駆動開発における設計思想 認知負荷を下げるフロントエンドアーキテクチャ/ 20251211 Teppei Hanai
shift_evolve
PRO
2
360
AIプラットフォームにおけるMLflowの利用について
lycorptech_jp
PRO
1
110
LLM-Readyなデータ基盤を高速に構築するためのアジャイルデータモデリングの実例
kashira
0
240
[JAWS-UG 横浜支部 #91]DevOps Agent vs CloudWatch Investigations -比較と実践-
sh_fk2
2
250
新 Security HubがついにGA!仕組みや料金を深堀り #AWSreInvent #regrowth / AWS Security Hub Advanced GA
masahirokawahara
1
1.9k
グレートファイアウォールを自宅に建てよう
ctes091x
0
150
Lessons from Migrating to OpenSearch: Shard Design, Log Ingestion, and UI Decisions
sansantech
PRO
1
120
Rubyで楽して タスクを書きたい!
ahogappa
0
110
AWS Trainium3 をちょっと身近に感じたい
bigmuramura
1
140
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
[SF Ruby Conf 2025] Rails X
palkan
0
510
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Bash Introduction
62gerente
615
210k
Leading Effective Engineering Teams in the AI Era
addyosmani
8
1.3k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
390
Into the Great Unknown - MozCon
thekraken
40
2.2k
Unsuck your backbone
ammeep
671
58k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.2k
Typedesign – Prime Four
hannesfritz
42
2.9k
Transcript
จݙհʢʣ ࢀর༁Λඞཁͱ͠ͳ͍୯ޠࢄදݱʹΑΔ ҟݴޠؒྨࣅΛ༻͍ͨ༁จͷࣗಈධՁ ૬ాɹଠҰ Ԭٕज़Պֶେֶ ࣗવݴޠॲཧݚڀࣨ
LITERATURE ➤ ౻, ӽલ୩, ߥ. ࢀর༁Λඞཁͱ͠ͳ͍୯ޠࢄදݱʹΑΔҟݴޠؒྨࣅΛ༻͍ ͨ༁จͷࣗಈධՁ. ిࢠใ௨৴ֶձ. 2018.
ABSTRACT ➤ ࢀর༁Λ༻͍ͨ༁ͷධՁख๏͕ଘࡏ ➤ Ϣʔβ͕ػց༁Λར༻͢Δࡍࢀর༁Λ༻͍ͳ͍ ➤ QEɿࢀর༁ͷΘΓʹେنͳର༁ίʔύεΛ༻͍Δ ➤ ԤभҎ֎ͷݴޠͰର༁ίʔύε͕͍͠ ➤
ࢀর༁ɺର༁ίʔύεΛ༻͍ͳ͍ධՁํ๏ΛఏҊ
INTRODUCTION ➤ ݱঢ়ͷػց༁ඞͣਖ਼͍͠༁Λग़ྗ͢ΔͱݶΒͳ͍ ➤ খઆͳͲͷந͕ߴ͍จॻͰਖ਼͘͠༁ͤͳ͍ࣄ͕ଟ͍ ➤ ࢀর༁ɺର༁ίʔύεΛ༻͍ͯग़ྗΛධՁ ➤ ࢀর༁ɿ༁จͷ࣭ྔʹґଘ ➤
ର༁ίʔύεɿେنͰ͋Δલఏ ➤ ୯ޠͷҟݴޠؒྨࣅ͔ΒධՁ͢Δख๏ΛఏҊ
PROPOSAL 1. ୯ޠࢄදݱΛֶश 2. ༁ߦྻͰϚοϐϯά 3. ҟݴޠؒྨࣅͷܭࢉ 4. ྨࣅͷग़ྗ
PROPOSALʼ ୯ޠࢄදݱΛֶश ➤ WikipediaͷσʔλͰֶश ➤ ӳޠɿ1.3GB ➤ ຊޠɿ850MB ➤ ࣍ͷurl͔Βμϯϩʔυ
https://dumps.wikimedia.org ➤ ݴޠ͝ͱʹهࣄͷ͕ҟͳΔ ➤ ӳޠ൛ͷํ͕ଟ͔ͬͨ
PROPOSALʼ ༁ߦྻͰϚοϐϯά ➤ ಘΒΕͨࢄදݱΛҟݴޠؒͰൺֱ͍ͨ͠ ➤ Word2VecͰɺҟݴޠؒʹ͓͍ͯ୯ޠؒͷ͕ؔྨࣅ ➤ ϕΫτϧҟͳΔͨΊɺྨࣅܭࢉͰ͖ͳ͍ ➤ ઢܗมɿ༁ߦྻW
➤ ୯ޠϖΞ(xi , zi )Λ࠷খೋ๏Ͱۙࣅ͢Δ
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ1 ➤ ΞϥΠϝϯτ ➤ จؒͷྨࣅΛܭࢉ͢Δࡍɺෆཁͳ୯ޠؒͷܭࢉϊΠζ ➤ શͯͷ୯ޠؒͰΞϥΠϝϯτείΞΛܭࢉ ➤ ҎԼͷΑ͏ʹͯ͠୯ޠϕΫτϧؒͷίαΠϯྨࣅ
di Λઃఆ ➤ DICEʢଜΒͷॏΈ͖DICEΛ࠾༻ʣ ➤ ୯ޠؒͷڞىใ f ͔Βܭࢉ tɿᮢʢҙʣ
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ2 ➤ EMDɿEarth Mover’s Distance ➤ ྨࣅը૾ݕࡧʹ༻͍ΒΕΔख๏ ➤ ؒͷڑΛ࠷దԽ͢Δࡍɺ༌ૹΛͱʹఆٛ
➤ ֤P , QͦΕͧΕಛྔͱॏΈ͔ΒͳΔγάωνϟͷू߹ ➤ pi ͔Βqj ʹ༌ૹ͢Δ߹ ➤ dij ɿ2ؒͷڑ ➤ fij ɿ༌ૹ͢Δՙྔ ➤ ࣄྔWORKΛ࠷খԽ Ҿ༻ɿ[1]
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ3 ➤ EMDɿEarth Mover’s Distance ➤ ҎԼ4ͭͷ੍݅ ➤ ಘΒΕͨ࠷దղ
f*ij Λ༻͍ͯɺ P , QؒͷڑΛܭࢉ Ҿ༻ɿ[1]
PROPOSALʼ ྨࣅͷग़ྗ ➤ ࠓճͷ݅ʹ͓͍ͯɺdijɿҟݴޠؒͷ୯ޠͷྨࣅ ➤ ಘΒΕͨEMDΑΓɺจؒͷྨࣅҎԼͷΑ͏ʹදͤΔ
EXPERIMENT ➤ σʔλ ➤ ʮThe Old Capitalʯ ➤ ݪจɿ߁ʮݹʯ ➤
಄100จΛ༻ ➤ ༁ʢӳˠʣ ➤ Google༁ ➤ Microsoft Translator ➤ Excite༁ ➤ ༁จͷධՁʢਓखʣ ➤ 8ਓͷཧܥେֶӃੜ ➤ 5ஈ֊ͰධՁ ➤ શһͷฏۉΛ༁จͷͱͨ͠
EXPERIMENT ➤ σʔλ ➤ ʮThe Old Capitalʯ ➤ ݪจɿ߁ʮݹʯ ➤
಄100จΛ༻ ➤ ༁ʢӳˠʣ ➤ Google༁ ➤ Microsoft Translator ➤ Excite༁ ➤ ༁จͷධՁʢਓखʣ ➤ 8ਓͷཧܥେֶӃੜ ➤ 5ஈ֊ͰධՁ ➤ શһͷฏۉΛ༁จͷͱͨ͠ ਓखධՁͷॱҐ༁ 1→༁ 2→༁ 3
EXPERIMENT ➤ ධՁํ๏ ɹ3ͭͷ༁จʹରͯ͠ɺྨࣅॱʹॱҐΛ࡞ ×100จ ➤ ਖ਼ղʢਓखͱͷશҰகʣ ➤ έϯυʔϧͷॱҐ૬ؔ ➤
༁จͷॱҐͷେখؔͷ૬ؔ ➤ ൺֱର ➤ ఏҊख๏ ➤ ॏΈʴΞϥΠϝϯτ ➤ ॏΈͳ͠ ➤ ΞϥΠϝϯτͳ͠ ➤ ࣗಈධՁई ➤ METEOR ➤ RIBES
RESULT ➤ ఏҊख๏METEORΛ্ճΓɺRIBES ʹഭΔ݁Ռ ➤ ୯ޠͷΞϥΠϝϯτ͕େ͖͘࡞༻͍ͯͨ͠
DISCUSSION ➤ ఏҊख๏ͷᮢʹର͢ΔҰகɺॱҐ૬ؔ ➤ ᮢΛ্͛Δ΄ͲҰக্͕Δ ➤ ᮢ0.73, 1.46ͰϐʔΫΛܴ͑Δ͕ɺޙऀҰக͕গͳ͍ ➤ ᮢ͕ߴ͘ͳΔ΄Ͳܭࢉʹඞཁͳ୯ޠϖΞഉআ͞ΕΔ
DISCUSSION ➤ RIBESਓखͱࣅͨॱͰධՁ͍ͯ͠Δ͕ɺఏҊख๏ҟͳΔ ➤ ఏҊख๏༁ௐͷ༁จΛߴ͘ධՁ͕ͪ͠
CONCLUSION ➤ ࢀর༁ର༁ίʔύε༻͍ͳ͍ධՁख๏ΛఏҊ ➤ ҟݴޠؒͷࢄදݱΛઢܗม͢Δ༁ߦྻ ➤ ྨࣅը૾ݕࡧʹ༻͍ΒΕΔEMDͰจؒྨࣅΛࢉग़ ➤ METEORΛ্ճΓɺRIBESʹഭΔ݁Ռͱͳͬͨ ➤
ఏҊख๏ͷੑೳʹ୯ޠͷΞϥΠϝϯτ͕ޮ͍͍ͯͨ ➤ ࢺใΛߟྀ͠ɺ୯ޠͷΞϥΠϝϯτΛվળ͍ͨ͠
REFERENCES 1. aidiary. Earth Mover’s Distance(EMD). ਓೳʹؔ͢Δஅ. 2012. http://aidiary.hatenablog.com/entry/20120804/1344058475