Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
文献紹介:参照訳を必要としない単語分散表現による異言語間類似度を用いた訳文の自動評価
Search
Taichi Aida
June 12, 2019
Technology
0
140
文献紹介:参照訳を必要としない単語分散表現による異言語間類似度を用いた訳文の自動評価
Taichi Aida
June 12, 2019
Tweet
Share
More Decks by Taichi Aida
See All by Taichi Aida
PhD Defence: Considering Temporal and Contextual Information for Lexical Semantic Change Detection
a1da4
1
210
文献紹介:A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications
a1da4
1
300
YANS2024:目指せ国際会議!「ネットワーキングの極意(国際会議編)」
a1da4
0
230
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
360
新入生向けチュートリアル:文献のサーベイv2
a1da4
15
10k
文献紹介:Isotropic Representation Can Improve Zero-Shot Cross-Lingual Transfer on Multilingual Language Models
a1da4
0
180
文献紹介:WhitenedCSE: Whitening-based Contrastive Learning of Sentence Embeddings
a1da4
1
290
文献紹介:On the Transformation of Latent Space in Fine-Tuned NLP Models
a1da4
0
110
新入生向けチュートリアル:文献のサーベイ
a1da4
0
490
Other Decks in Technology
See All in Technology
『FailNet~やらかし共有SNS~』エレベーターピッチ
yokomachi
1
190
Figma + Storybook + PlaywrightのMCPを使ったフロントエンド開発
yug1224
10
3.6k
Kubernetes における cgroup driver のしくみ: runwasi の bugfix より
z63d
2
110
シークレット管理だけじゃない!HashiCorp Vault でデータ暗号化をしよう / Beyond Secret Management! Let's Encrypt Data with HashiCorp Vault
nnstt1
2
130
DDD集約とサービスコンテキスト境界との関係性
pandayumi
2
220
実践アプリケーション設計 ③ドメイン駆動設計
recruitengineers
PRO
13
4.1k
250905 大吉祥寺.pm 2025 前夜祭 「プログラミングに出会って20年、『今』が1番楽しい」
msykd
PRO
1
220
ライブサービスゲームQAのパフォーマンス検証による品質改善の取り組み
gree_tech
PRO
0
430
20250903_1つのAWSアカウントに複数システムがある環境におけるアクセス制御をABACで実現.pdf
yhana
2
250
Kiroと学ぶコンテキストエンジニアリング
oikon48
5
6.2k
Kubernetes における cgroup v2 でのOut-Of-Memory 問題の解決
pfn
PRO
0
440
「魔法少女まどか☆マギカ Magia Exedra」での負荷試験の実践と学び
gree_tech
PRO
0
440
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
830
Embracing the Ebb and Flow
colly
87
4.8k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.5k
Optimizing for Happiness
mojombo
379
70k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Fireside Chat
paigeccino
39
3.6k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Imperfection Machines: The Place of Print at Facebook
scottboms
268
13k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Gamification - CAS2011
davidbonilla
81
5.4k
Balancing Empowerment & Direction
lara
3
610
Transcript
จݙհʢʣ ࢀর༁Λඞཁͱ͠ͳ͍୯ޠࢄදݱʹΑΔ ҟݴޠؒྨࣅΛ༻͍ͨ༁จͷࣗಈධՁ ૬ాɹଠҰ Ԭٕज़Պֶେֶ ࣗવݴޠॲཧݚڀࣨ
LITERATURE ➤ ౻, ӽલ୩, ߥ. ࢀর༁Λඞཁͱ͠ͳ͍୯ޠࢄදݱʹΑΔҟݴޠؒྨࣅΛ༻͍ ͨ༁จͷࣗಈධՁ. ిࢠใ௨৴ֶձ. 2018.
ABSTRACT ➤ ࢀর༁Λ༻͍ͨ༁ͷධՁख๏͕ଘࡏ ➤ Ϣʔβ͕ػց༁Λར༻͢Δࡍࢀর༁Λ༻͍ͳ͍ ➤ QEɿࢀর༁ͷΘΓʹେنͳର༁ίʔύεΛ༻͍Δ ➤ ԤभҎ֎ͷݴޠͰର༁ίʔύε͕͍͠ ➤
ࢀর༁ɺର༁ίʔύεΛ༻͍ͳ͍ධՁํ๏ΛఏҊ
INTRODUCTION ➤ ݱঢ়ͷػց༁ඞͣਖ਼͍͠༁Λग़ྗ͢ΔͱݶΒͳ͍ ➤ খઆͳͲͷந͕ߴ͍จॻͰਖ਼͘͠༁ͤͳ͍ࣄ͕ଟ͍ ➤ ࢀর༁ɺର༁ίʔύεΛ༻͍ͯग़ྗΛධՁ ➤ ࢀর༁ɿ༁จͷ࣭ྔʹґଘ ➤
ର༁ίʔύεɿେنͰ͋Δલఏ ➤ ୯ޠͷҟݴޠؒྨࣅ͔ΒධՁ͢Δख๏ΛఏҊ
PROPOSAL 1. ୯ޠࢄදݱΛֶश 2. ༁ߦྻͰϚοϐϯά 3. ҟݴޠؒྨࣅͷܭࢉ 4. ྨࣅͷग़ྗ
PROPOSALʼ ୯ޠࢄදݱΛֶश ➤ WikipediaͷσʔλͰֶश ➤ ӳޠɿ1.3GB ➤ ຊޠɿ850MB ➤ ࣍ͷurl͔Βμϯϩʔυ
https://dumps.wikimedia.org ➤ ݴޠ͝ͱʹهࣄͷ͕ҟͳΔ ➤ ӳޠ൛ͷํ͕ଟ͔ͬͨ
PROPOSALʼ ༁ߦྻͰϚοϐϯά ➤ ಘΒΕͨࢄදݱΛҟݴޠؒͰൺֱ͍ͨ͠ ➤ Word2VecͰɺҟݴޠؒʹ͓͍ͯ୯ޠؒͷ͕ؔྨࣅ ➤ ϕΫτϧҟͳΔͨΊɺྨࣅܭࢉͰ͖ͳ͍ ➤ ઢܗมɿ༁ߦྻW
➤ ୯ޠϖΞ(xi , zi )Λ࠷খೋ๏Ͱۙࣅ͢Δ
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ1 ➤ ΞϥΠϝϯτ ➤ จؒͷྨࣅΛܭࢉ͢Δࡍɺෆཁͳ୯ޠؒͷܭࢉϊΠζ ➤ શͯͷ୯ޠؒͰΞϥΠϝϯτείΞΛܭࢉ ➤ ҎԼͷΑ͏ʹͯ͠୯ޠϕΫτϧؒͷίαΠϯྨࣅ
di Λઃఆ ➤ DICEʢଜΒͷॏΈ͖DICEΛ࠾༻ʣ ➤ ୯ޠؒͷڞىใ f ͔Βܭࢉ tɿᮢʢҙʣ
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ2 ➤ EMDɿEarth Mover’s Distance ➤ ྨࣅը૾ݕࡧʹ༻͍ΒΕΔख๏ ➤ ؒͷڑΛ࠷దԽ͢Δࡍɺ༌ૹΛͱʹఆٛ
➤ ֤P , QͦΕͧΕಛྔͱॏΈ͔ΒͳΔγάωνϟͷू߹ ➤ pi ͔Βqj ʹ༌ૹ͢Δ߹ ➤ dij ɿ2ؒͷڑ ➤ fij ɿ༌ૹ͢Δՙྔ ➤ ࣄྔWORKΛ࠷খԽ Ҿ༻ɿ[1]
PROPOSALʼ ҟݴޠؒྨࣅͷܭࢉ3 ➤ EMDɿEarth Mover’s Distance ➤ ҎԼ4ͭͷ੍݅ ➤ ಘΒΕͨ࠷దղ
f*ij Λ༻͍ͯɺ P , QؒͷڑΛܭࢉ Ҿ༻ɿ[1]
PROPOSALʼ ྨࣅͷग़ྗ ➤ ࠓճͷ݅ʹ͓͍ͯɺdijɿҟݴޠؒͷ୯ޠͷྨࣅ ➤ ಘΒΕͨEMDΑΓɺจؒͷྨࣅҎԼͷΑ͏ʹදͤΔ
EXPERIMENT ➤ σʔλ ➤ ʮThe Old Capitalʯ ➤ ݪจɿ߁ʮݹʯ ➤
಄100จΛ༻ ➤ ༁ʢӳˠʣ ➤ Google༁ ➤ Microsoft Translator ➤ Excite༁ ➤ ༁จͷධՁʢਓखʣ ➤ 8ਓͷཧܥେֶӃੜ ➤ 5ஈ֊ͰධՁ ➤ શһͷฏۉΛ༁จͷͱͨ͠
EXPERIMENT ➤ σʔλ ➤ ʮThe Old Capitalʯ ➤ ݪจɿ߁ʮݹʯ ➤
಄100จΛ༻ ➤ ༁ʢӳˠʣ ➤ Google༁ ➤ Microsoft Translator ➤ Excite༁ ➤ ༁จͷධՁʢਓखʣ ➤ 8ਓͷཧܥେֶӃੜ ➤ 5ஈ֊ͰධՁ ➤ શһͷฏۉΛ༁จͷͱͨ͠ ਓखධՁͷॱҐ༁ 1→༁ 2→༁ 3
EXPERIMENT ➤ ධՁํ๏ ɹ3ͭͷ༁จʹରͯ͠ɺྨࣅॱʹॱҐΛ࡞ ×100จ ➤ ਖ਼ղʢਓखͱͷશҰகʣ ➤ έϯυʔϧͷॱҐ૬ؔ ➤
༁จͷॱҐͷେখؔͷ૬ؔ ➤ ൺֱର ➤ ఏҊख๏ ➤ ॏΈʴΞϥΠϝϯτ ➤ ॏΈͳ͠ ➤ ΞϥΠϝϯτͳ͠ ➤ ࣗಈධՁई ➤ METEOR ➤ RIBES
RESULT ➤ ఏҊख๏METEORΛ্ճΓɺRIBES ʹഭΔ݁Ռ ➤ ୯ޠͷΞϥΠϝϯτ͕େ͖͘࡞༻͍ͯͨ͠
DISCUSSION ➤ ఏҊख๏ͷᮢʹର͢ΔҰகɺॱҐ૬ؔ ➤ ᮢΛ্͛Δ΄ͲҰக্͕Δ ➤ ᮢ0.73, 1.46ͰϐʔΫΛܴ͑Δ͕ɺޙऀҰக͕গͳ͍ ➤ ᮢ͕ߴ͘ͳΔ΄Ͳܭࢉʹඞཁͳ୯ޠϖΞഉআ͞ΕΔ
DISCUSSION ➤ RIBESਓखͱࣅͨॱͰධՁ͍ͯ͠Δ͕ɺఏҊख๏ҟͳΔ ➤ ఏҊख๏༁ௐͷ༁จΛߴ͘ධՁ͕ͪ͠
CONCLUSION ➤ ࢀর༁ର༁ίʔύε༻͍ͳ͍ධՁख๏ΛఏҊ ➤ ҟݴޠؒͷࢄදݱΛઢܗม͢Δ༁ߦྻ ➤ ྨࣅը૾ݕࡧʹ༻͍ΒΕΔEMDͰจؒྨࣅΛࢉग़ ➤ METEORΛ্ճΓɺRIBESʹഭΔ݁Ռͱͳͬͨ ➤
ఏҊख๏ͷੑೳʹ୯ޠͷΞϥΠϝϯτ͕ޮ͍͍ͯͨ ➤ ࢺใΛߟྀ͠ɺ୯ޠͷΞϥΠϝϯτΛվળ͍ͨ͠
REFERENCES 1. aidiary. Earth Mover’s Distance(EMD). ਓೳʹؔ͢Δஅ. 2012. http://aidiary.hatenablog.com/entry/20120804/1344058475