Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:参照訳を必要としない単語分散表現による異言語間類似度を用いた訳文の自動評価
Search
Taichi Aida
June 12, 2019
Technology
0
140
文献紹介:参照訳を必要としない単語分散表現による異言語間類似度を用いた訳文の自動評価
Taichi Aida
June 12, 2019
Tweet
Share
More Decks by Taichi Aida
See All by Taichi Aida
意味を表すベクトル表現を用いたテキスト分析
a1da4
0
42
PhD Defence: Considering Temporal and Contextual Information for Lexical Semantic Change Detection
a1da4
1
220
文献紹介:A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications
a1da4
1
330
YANS2024:目指せ国際会議!「ネットワーキングの極意(国際会議編)」
a1da4
0
250
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
370
新入生向けチュートリアル:文献のサーベイv2
a1da4
15
11k
文献紹介:Isotropic Representation Can Improve Zero-Shot Cross-Lingual Transfer on Multilingual Language Models
a1da4
0
180
文献紹介:WhitenedCSE: Whitening-based Contrastive Learning of Sentence Embeddings
a1da4
1
290
文献紹介:On the Transformation of Latent Space in Fine-Tuned NLP Models
a1da4
0
110
Other Decks in Technology
See All in Technology
サイバーエージェント流クラウドコスト削減施策「みんなで金塊堀太郎」
kurochan
3
1.9k
ガバメントクラウド(AWS)へのデータ移行戦略の立て方【虎の巻】 / 20251011 Mitsutosi Matsuo
shift_evolve
PRO
2
200
Claude Code Subagents 再入門 ~cc-sddの実装で学んだこと~
gotalab555
7
11k
AWS Control Tower に学ぶ! IAM Identity Center 権限設計の第一歩 / IAM Identity Center with Control Tower
y___u
0
170
物体検出モデルでシイタケの収穫時期を自動判定してみた。 #devio2025
lamaglama39
0
130
AWSでAgentic AIを開発するための前提知識の整理
nasuvitz
2
160
「使い方教えて」「事例教えて」じゃもう遅い! Microsoft 365 Copilot を触り倒そう!
taichinakamura
0
390
Wasmのエコシステムを使った ツール作成方法
askua
0
180
セキュアな認可付きリモートMCPサーバーをAWSマネージドサービスでつくろう! / Let's build an OAuth protected remote MCP server based on AWS managed services
kaminashi
3
330
20251010_HCCJP_AdaptiveCloudUpdates
sdosamut
0
130
綺麗なデータマートをつくろう_データ整備を前向きに考える会 / Let's create clean data mart
brainpadpr
3
520
AWS Top Engineer、浮いてませんか? / As an AWS Top Engineer, Are You Out of Place?
yuj1osm
2
210
Featured
See All Featured
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
8
910
Mobile First: as difficult as doing things right
swwweet
224
10k
Embracing the Ebb and Flow
colly
88
4.8k
For a Future-Friendly Web
brad_frost
180
10k
Designing for Performance
lara
610
69k
Bash Introduction
62gerente
615
210k
Writing Fast Ruby
sferik
629
62k
Raft: Consensus for Rubyists
vanstee
140
7.1k
Unsuck your backbone
ammeep
671
58k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
870
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
61k
Transcript
จݙհʢʣ ࢀর༁Λඞཁͱ͠ͳ͍୯ޠࢄදݱʹΑΔ ҟݴޠؒྨࣅΛ༻͍ͨ༁จͷࣗಈධՁ ૬ాɹଠҰ Ԭٕज़Պֶେֶ ࣗવݴޠॲཧݚڀࣨ
LITERATURE ➤ ౻, ӽલ୩, ߥ. ࢀর༁Λඞཁͱ͠ͳ͍୯ޠࢄදݱʹΑΔҟݴޠؒྨࣅΛ༻͍ ͨ༁จͷࣗಈධՁ. ిࢠใ௨৴ֶձ. 2018.
ABSTRACT ➤ ࢀর༁Λ༻͍ͨ༁ͷධՁख๏͕ଘࡏ ➤ Ϣʔβ͕ػց༁Λར༻͢Δࡍࢀর༁Λ༻͍ͳ͍ ➤ QEɿࢀর༁ͷΘΓʹେنͳର༁ίʔύεΛ༻͍Δ ➤ ԤभҎ֎ͷݴޠͰର༁ίʔύε͕͍͠ ➤
ࢀর༁ɺର༁ίʔύεΛ༻͍ͳ͍ධՁํ๏ΛఏҊ
INTRODUCTION ➤ ݱঢ়ͷػց༁ඞͣਖ਼͍͠༁Λग़ྗ͢ΔͱݶΒͳ͍ ➤ খઆͳͲͷந͕ߴ͍จॻͰਖ਼͘͠༁ͤͳ͍ࣄ͕ଟ͍ ➤ ࢀর༁ɺର༁ίʔύεΛ༻͍ͯग़ྗΛධՁ ➤ ࢀর༁ɿ༁จͷ࣭ྔʹґଘ ➤
ର༁ίʔύεɿେنͰ͋Δલఏ ➤ ୯ޠͷҟݴޠؒྨࣅ͔ΒධՁ͢Δख๏ΛఏҊ
PROPOSAL 1. ୯ޠࢄදݱΛֶश 2. ༁ߦྻͰϚοϐϯά 3. ҟݴޠؒྨࣅͷܭࢉ 4. ྨࣅͷग़ྗ
PROPOSALʼ ୯ޠࢄදݱΛֶश ➤ WikipediaͷσʔλͰֶश ➤ ӳޠɿ1.3GB ➤ ຊޠɿ850MB ➤ ࣍ͷurl͔Βμϯϩʔυ
https://dumps.wikimedia.org ➤ ݴޠ͝ͱʹهࣄͷ͕ҟͳΔ ➤ ӳޠ൛ͷํ͕ଟ͔ͬͨ
PROPOSALʼ ༁ߦྻͰϚοϐϯά ➤ ಘΒΕͨࢄදݱΛҟݴޠؒͰൺֱ͍ͨ͠ ➤ Word2VecͰɺҟݴޠؒʹ͓͍ͯ୯ޠؒͷ͕ؔྨࣅ ➤ ϕΫτϧҟͳΔͨΊɺྨࣅܭࢉͰ͖ͳ͍ ➤ ઢܗมɿ༁ߦྻW
➤ ୯ޠϖΞ(xi , zi )Λ࠷খೋ๏Ͱۙࣅ͢Δ
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ1 ➤ ΞϥΠϝϯτ ➤ จؒͷྨࣅΛܭࢉ͢Δࡍɺෆཁͳ୯ޠؒͷܭࢉϊΠζ ➤ શͯͷ୯ޠؒͰΞϥΠϝϯτείΞΛܭࢉ ➤ ҎԼͷΑ͏ʹͯ͠୯ޠϕΫτϧؒͷίαΠϯྨࣅ
di Λઃఆ ➤ DICEʢଜΒͷॏΈ͖DICEΛ࠾༻ʣ ➤ ୯ޠؒͷڞىใ f ͔Βܭࢉ tɿᮢʢҙʣ
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ2 ➤ EMDɿEarth Mover’s Distance ➤ ྨࣅը૾ݕࡧʹ༻͍ΒΕΔख๏ ➤ ؒͷڑΛ࠷దԽ͢Δࡍɺ༌ૹΛͱʹఆٛ
➤ ֤P , QͦΕͧΕಛྔͱॏΈ͔ΒͳΔγάωνϟͷू߹ ➤ pi ͔Βqj ʹ༌ૹ͢Δ߹ ➤ dij ɿ2ؒͷڑ ➤ fij ɿ༌ૹ͢Δՙྔ ➤ ࣄྔWORKΛ࠷খԽ Ҿ༻ɿ[1]
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ3 ➤ EMDɿEarth Mover’s Distance ➤ ҎԼ4ͭͷ੍݅ ➤ ಘΒΕͨ࠷దղ
f*ij Λ༻͍ͯɺ P , QؒͷڑΛܭࢉ Ҿ༻ɿ[1]
PROPOSALʼ ྨࣅͷग़ྗ ➤ ࠓճͷ݅ʹ͓͍ͯɺdijɿҟݴޠؒͷ୯ޠͷྨࣅ ➤ ಘΒΕͨEMDΑΓɺจؒͷྨࣅҎԼͷΑ͏ʹදͤΔ
EXPERIMENT ➤ σʔλ ➤ ʮThe Old Capitalʯ ➤ ݪจɿ߁ʮݹʯ ➤
಄100จΛ༻ ➤ ༁ʢӳˠʣ ➤ Google༁ ➤ Microsoft Translator ➤ Excite༁ ➤ ༁จͷධՁʢਓखʣ ➤ 8ਓͷཧܥେֶӃੜ ➤ 5ஈ֊ͰධՁ ➤ શһͷฏۉΛ༁จͷͱͨ͠
EXPERIMENT ➤ σʔλ ➤ ʮThe Old Capitalʯ ➤ ݪจɿ߁ʮݹʯ ➤
಄100จΛ༻ ➤ ༁ʢӳˠʣ ➤ Google༁ ➤ Microsoft Translator ➤ Excite༁ ➤ ༁จͷධՁʢਓखʣ ➤ 8ਓͷཧܥେֶӃੜ ➤ 5ஈ֊ͰධՁ ➤ શһͷฏۉΛ༁จͷͱͨ͠ ਓखධՁͷॱҐ༁ 1→༁ 2→༁ 3
EXPERIMENT ➤ ධՁํ๏ ɹ3ͭͷ༁จʹରͯ͠ɺྨࣅॱʹॱҐΛ࡞ ×100จ ➤ ਖ਼ղʢਓखͱͷશҰகʣ ➤ έϯυʔϧͷॱҐ૬ؔ ➤
༁จͷॱҐͷେখؔͷ૬ؔ ➤ ൺֱର ➤ ఏҊख๏ ➤ ॏΈʴΞϥΠϝϯτ ➤ ॏΈͳ͠ ➤ ΞϥΠϝϯτͳ͠ ➤ ࣗಈධՁई ➤ METEOR ➤ RIBES
RESULT ➤ ఏҊख๏METEORΛ্ճΓɺRIBES ʹഭΔ݁Ռ ➤ ୯ޠͷΞϥΠϝϯτ͕େ͖͘࡞༻͍ͯͨ͠
DISCUSSION ➤ ఏҊख๏ͷᮢʹର͢ΔҰகɺॱҐ૬ؔ ➤ ᮢΛ্͛Δ΄ͲҰக্͕Δ ➤ ᮢ0.73, 1.46ͰϐʔΫΛܴ͑Δ͕ɺޙऀҰக͕গͳ͍ ➤ ᮢ͕ߴ͘ͳΔ΄Ͳܭࢉʹඞཁͳ୯ޠϖΞഉআ͞ΕΔ
DISCUSSION ➤ RIBESਓखͱࣅͨॱͰධՁ͍ͯ͠Δ͕ɺఏҊख๏ҟͳΔ ➤ ఏҊख๏༁ௐͷ༁จΛߴ͘ධՁ͕ͪ͠
CONCLUSION ➤ ࢀর༁ର༁ίʔύε༻͍ͳ͍ධՁख๏ΛఏҊ ➤ ҟݴޠؒͷࢄදݱΛઢܗม͢Δ༁ߦྻ ➤ ྨࣅը૾ݕࡧʹ༻͍ΒΕΔEMDͰจؒྨࣅΛࢉग़ ➤ METEORΛ্ճΓɺRIBESʹഭΔ݁Ռͱͳͬͨ ➤
ఏҊख๏ͷੑೳʹ୯ޠͷΞϥΠϝϯτ͕ޮ͍͍ͯͨ ➤ ࢺใΛߟྀ͠ɺ୯ޠͷΞϥΠϝϯτΛվળ͍ͨ͠
REFERENCES 1. aidiary. Earth Mover’s Distance(EMD). ਓೳʹؔ͢Δஅ. 2012. http://aidiary.hatenablog.com/entry/20120804/1344058475