Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
対訳コーパスから生成したワードグラフによる部分的機械翻訳
Search
自然言語処理研究室
March 31, 2013
Research
0
160
対訳コーパスから生成したワードグラフによる部分的機械翻訳
井手上 雅迪. 対訳コーパスから生成したワードグラフによる部分的機械翻訳. 長岡技術科学大学修士論文 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
470
データサイエンス12_分類.pdf
jnlp
0
330
データサイエンス11_前処理.pdf
jnlp
0
450
Recurrent neural network based language model
jnlp
0
130
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
93
自然言語処理研究室 研究概要(2014年)
jnlp
0
110
自然言語処理研究室 研究概要(2015年)
jnlp
0
180
Other Decks in Research
See All in Research
Towards a More Efficient Reasoning LLM: AIMO2 Solution Summary and Introduction to Fast-Math Models
analokmaus
2
220
Type Theory as a Formal Basis of Natural Language Semantics
daikimatsuoka
1
220
大規模な2値整数計画問題に対する 効率的な重み付き局所探索法
mickey_kubo
1
240
NLP2025 WS Shared Task 文法誤り訂正部門 ehiMetrick
sugiyamaseiji
0
190
SSII2025 [TS2] リモートセンシング画像処理の最前線
ssii
PRO
7
2.8k
ことばの意味を計算するしくみ
verypluming
11
2.6k
Computational OT #4 - Gradient flow and diffusion models
gpeyre
0
290
データxデジタルマップで拓く ミラノ発・地域共創最前線
mapconcierge4agu
0
170
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
480
言語モデルの内部機序:解析と解釈
eumesy
PRO
48
18k
時系列データに対する解釈可能な 決定木クラスタリング
mickey_kubo
2
700
データサイエンティストの採用に関するアンケート
datascientistsociety
PRO
0
980
Featured
See All Featured
VelocityConf: Rendering Performance Case Studies
addyosmani
330
24k
How to Ace a Technical Interview
jacobian
277
23k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Facilitating Awesome Meetings
lara
54
6.4k
A Tale of Four Properties
chriscoyier
160
23k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.5k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
17
940
Documentation Writing (for coders)
carmenintech
72
4.9k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
Building a Modern Day E-commerce SEO Strategy
aleyda
42
7.3k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Transcript
ର༁ίʔύε͔Βੜͨ͠ ϫʔυάϥϑʹΑΔ෦తػց༁ ిؾܥɹࢁຊݚڀࣨ Ҫख্խ
എܠ Ұ෦ใΛམͱͯ͠ྑ͍ͷͰ ͘ਫ਼ͷߴ͍༁͕ཉ͍͠ ༁ΛಡΉϢʔβͷࢹɿ ؒҧ͍ͬͯΔ͔͠Εͳ͍ػց༁Λಡ Ήͷਫ਼ਆతෛ୲ˠ͍ʹ͍͘ ػց༁ͷൃୡ֮͘͠ɺ ۙͰҰ෦ͷ&$αΠτͰ࣮༻Խ͞Ε͍ͯΔ ػց༁ͷग़ྗΤϥʔΛؚΉ
എܠ &$αΠτӡӦऀ͔Βͷࢹɿ ɾ͘ɺਫ਼ͷߴ͍༁ཉ͍͠ ɾͲͷใ͕མͱ͞ΕͯɺͲͷใ͕ Δͷ͔ίϯτϩʔϧͰ͖ͳ͍ͷ ೖྗจɾग़ྗʹͯ͠΄͍͠෦తදݱ ༁ث ೖྗͷҰ෦Λத৺ͱͨ͠༁
త ෦తػց༁ͷఏҊ ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ͓ഽʹ५͍Λ༩͑ɺഽΛ݈͔ʹอͪ·͢ʣ ഽΛ͔͢͜ʹอͭ ࢦఆ͞Εͨ෦తදݱΛத৺ͱͨ͠༁ ෦తදݱɿ5IJTQSPEVDULFFQT
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
ೖྗจ ෦తදݱ ೖྗ ର༁ίʔύε ݪݴޠଆ ग़ྗݴޠଆ ݕࡧ ର༁จू߹ 4 &
ϫʔυάϥϑ࡞ 4 & ̏ ̎ ΤοδॏΈ͚ 4 & ̏ ̎ ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
ఏҊख๏֓ཁ ෦తදݱɿUIJTQSPEVDULFFQT ༩͑ΒΕͨ෦తදݱͰର༁ίʔύεΛݕࡧ ର༁จू߹Λऔಘ ӳޠଆ ର༁จू߹ʢຊޠଆʣ 5IJTQSPEVDULFFQTd ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ 5IJTQSPEVDUdLFFQT ഽΛॊೈͰ͔͢͜ʹอͭ
5IJTQSPEVDULFFQTd ഽΛ͔͢͜ʹอͪ·͢ "MTP UIJTQSPEVDULFFQTd ·ͨɺ͓ഽʹͬ͠ͱΓͱอͪ·͢ ʙ ʙ
ఏҊख๏֓ཁ ର༁จू߹Λ୯ޠׂ ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ ഽΛॊೈͰ͔͢͜ʹอͭ ഽΛ͔͢͜ʹอͪ·͢ ͓ഽʹͬ͠ͱΓͱอͪ·͢ ͓ഽΛอޢ͔͢͜͠ʹอͪ·͢ ֤ޠΛϊʔυɺޠͱޠͷܨ͕ΓΛΤοδͱͯ͠ ϫʔυάϥϑΛ࡞
ఏҊख๏֓ཁ ର༁จू߹͔ΒϫʔυάϥϑΛ࡞ 45"35͔Β&/%·Ͱ ೖྗʹ߹Θͤͨ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ഽΛ͔͢͜ʹอͭ ఏҊख๏֓ཁ
ఏҊख๏֓ཁ wࠓճӳ༁Λߦ͏ wຊख๏ݴޠඇґଘ w෦తදݱͷநग़ͱର༁จू߹ʹΑΔϫʔ υάϥϑΛ࡞Ͱ͖Ε༁Մೳ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
࠷దͳܦ࿏બ ΤοδʹॏΈΛ͚ͭɺ࠷ܦ࿏ͱͯ͠ղ͘ ॏཁΤοδ είΞ ୯ޠ༁֬ είΞ ༁ީิͱ্ͯ͠Ґ̍̑ܦ࿏Λબ͠ɺ ΤοδͷฏۉॏΈͰ࠶ॱҐ͚ Еɿd
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ॏཁΤοδείΞ จू߹Ͱग़ݱස͕ߴ͍΄Ͳ ॏཁͳΤοδͩͱΈͳ͞ΕΔ ಉ͡෦తදݱͰநग़͞Εͨจू߹ʹ ڞ௨ͷදݱ͕ൺֱతߴ͍සͰؚ·ΕΔ
୯ޠ༁֬είΞ *#..PEFMʹΑΔ୯ޠ༁֬Λ༻͍Δ ෦తදݱ͕ಉ͡Ͱ ೖྗจʹΑͬͯ௨Δ͖ϊʔυ͕มԽ͢Δ ೖྗจͷจ຺Λө͢Δ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJOIFBMUIZ ഽΛ͔͢͜ʹอͭ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJONPJTU ഽΛॊೈʹͬ͠ͱΓͱอͪ·͢
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ϊʔυͷ݁߹ wʮ݈߁ˠతʯͱ͍͏ܦ࿏Λ௨Γͨͯ͘ ϊʔυ͕গͳ͘ͳΔʮॊೈʯΛ௨Ζ͏ͱ͢Δ wϊʔυݮΔʹ͋ΔͨΊɺఆܕදݱ ʹରͯ͠ෆར ʮ݈߁ɹతʯΛ݁߹͍ͨ͠
ϊʔυͷ݁߹ ग़ೖΓ͢ΔΤοδ͕̍ຊ͔͠ͳ͍ϊʔυಉ࢜݁߹
ϊʔυͷ݁߹ ର༁ίʔύεͰߴසͱͳΔޠ·ͱΊΔ ϊʔυͱͯ͠ಛΛ࣋ͨͳ͍
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁࢦඪ wධՁ༻ͷ෦తදݱ wఏҊख๏ͷ࣮ݧ݁Ռ
࣮ݧઃఆ ݈߁৯ؔ࿈ର༁ίʔύε ສର ʹର͠ ӳ༁ dจͷର༁จू߹Λ࣋ͭ෦తදݱͱ ೖྗจͷηοτΛ࡞ จೖྗʹ͏ʣ ͷ෦తදݱΛЕܾఆʹ ͷ෦తදݱΛධՁʹ༻
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ༻෦తදݱ w͋ΔఔಡΊΔΑ͏ͳߏ͕ྑ͍ wධՁऀʹఏࣔ͠ɺ෦తදݱΛத৺ͱ͠ ͨ༁ʹͳ͍ͬͯΔ͔֬ೝͤ͞ΔͨΊ ߏจղੳ݁Ռ͔Β෦తදݱΛࣗಈநग़ ධՁ༻ͷ෦తදݱ
෦తදݱநग़ྫ ղੳ 5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ det(product-2, This-1) nsubj(provides-3, product-2) nsubj(keeps-9, product-2)
conj_and(provides-3, keeps-9) nsubj(healthy-11, it-10) xcomp(keeps-9, healthy-11) ʜ EFUOTVCKͱ͍͏ύλʔϯʹ߹க͢Δ 5IJTQSPEVDULFFQTΛநग़
෦తදݱྫ $MJOUPOEFGFBUFE%PMF $MJOUPOEFGFBUFE 5IJTJTDIBSBDUFSJ[FECZVMUSBMJHIUXFJHIUBOEUIJO TMJEJOHBSFBBOEMPOHMFOHUI UIJTJTDIBSBDUFSJ[FE 5PCFVTFEGPSBGUFSCBUIDBSF BTXFMMBTCZUIPTF XJUIDPNCJOBUJPOTLJO TFOTJUJWFTLJO
PSUIFXIPMF GBNJMZ VTFEGPSDBSF
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁج४ w༁ਫ਼ wྲྀெ͞ w෦తදݱ͕༁͞Ε͍ͯΔ͔ ӳޠݍʹ̓ࡏॅ͍ͯͨ͠ຊޠऀʹ ධՁΛґཔ
༁ਫ਼ ग़ྗ݁Ռʹؚ·ΕΔ༰తਖ਼ղͷׂ߹ ஈ֊ධՁ ؒҧͬͨ༰ΛؚΜͰ͍ͳ͍
શʹؒҧ͍ͬͯΔʣ ೖྗจͷใΛશؚͯΜͰ͍ͳͯ͘ߴධՁʹͳΔ͜ͱ͕͋Δ
ྲྀெ͞ ຊޠͱͯ͠ͳ͠ Ұ෦͓͔͍͕͠ͳ͘ಡΊΔ ඇࠃޠత จষͱͯ͠ෆࣗવ ཧղͰ͖ͳ͍ ஈ֊ධՁ ຊޠจͱͯ͠ͷਖ਼͠͞ Ҏ্͋Εेͱ͍͏ج४
෦తදݱ ෦తදݱ͕༁͞Ε͍ͯΔ͔ ෦తදݱΛຊޠԽͨ͠ͷΛఏࣔ ͦͷ༰ؚ͕·Ε͍ͯΕ0 ؚ·Ε͍ͯͳ͚Ε9
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
ग़ྗจͷఔͷ෦͕ਖ਼͍͠ ྲྀெ̐͞Ҏ্͋Εेͩͱߟ͑Δ
ग़ྗྫ ೖྗɿ8FSFDPNNFOEUIBUZPVDPOTVMUXJUIZPVS EPDUPSJGVTJOHUIFQSPEVDUGPSUIFpSTUUJNF ͡Ίͯͷར༻ͷࡍҩऀʹ૬ஊ͢Δ͜ͱΛ͓͢͢Ί͠·͢ɻ ෦తදݱɿZPVDPOTVMU ͝૬ஊΛ͓͢͢Ί͠·͢ɻ
ग़ྗྫ ೖྗɿ.JOVUFGPBNXBTIFT NPJTUVSJ[FTBOE SFGSFTIZPVSTLJO Ωϝࡉ͔͍๐ཱͪͰ͓ഽΛεοΩϦɺͬ͠ͱΓͱચ্͍͛·͢ɻ ෦తදݱɿGPBNXBTIFT จू߹ͷจɿจ όεύϑɺ;Θ;ΘͷΞϫΛͭ͘Γɺ ༏͘͠แΉΑ͏ʹચ্͍͛·͢ɻ ର༁จू߹͕খ͍͞ͱ̍ϊʔυ͕͘ͳΔ
ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ΛݟΔͱฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ϊʔυ݁߹ํ๏ͷมߋ ର༁จू߹தͰߴසͷޠΛ݁߹
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ༁ਫ਼্͍ͯ͠Δ͕ʢ͕ਖ਼ղʣ ෦త༁Λத৺ͱͨ͠༁ͱͳ͍ͬͯͳ͍ ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ɿฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ॏཁϊʔυ ෦తදݱͱରԠ͢Δϊʔυͷ௨աΛڧ੍ UIJTQSPEVDULFFQT ॊೈ อͪ อͭ ෦తදݱʹର͢Δ୯ޠ༁֬ΛՃࢉɺ ͦͷείΞͰॱҐ͚Δ ʜ
อͪ อͭ ্Ґ̏ϊʔυ ͷ͍ͣΕ͔Λඞͣ௨ա
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ॏཁϊʔυ௨ա ˞ Е ˞ɹൃදऀධՁ ग़ྗจͷఔ͕ਖ਼ղͱͳΔ ͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
·ͱΊ wؒҧ͍ͬͯΔՄೳੑ͕͋Δػց༁ΛಡΉͷਫ਼ਆతෛ ୲ wݪจͷใΛམͱͯ͠ྑ͍ͷͰɺ෦తʹ༁͍ͨ͠ wϫʔυάϥϑΛ༻͍ͨ෦తػց༁ΛఏҊ ɾग़ྗจͷͷ෦͕ਖ਼ղͱ͍͏༁ਫ਼ ɾͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
म࢜จൃදձ·Ͱʹ wϫʔυάϥϑຖͷ༁݁Ռͷղੳ wϫʔυάϥϑͷߏʹग़ྗ݁Ռ͕େ͖ ͘ґଘ͍ͯ͠Δ wͲͷΑ͏ͳϫʔυάϥϑͩͱ༁ਫ਼ ͕ߴ͍ͷ͔Λௐࠪ wվળࡦͷఏҊ
ϕʔεϥΠϯ ର༁จू߹ͰݪݴޠଆΛར༻ͯ͠จԽ ॏཁΤοδείΞͷΈΛ༻͍Δ จԽ͞ΕͨೖྗจΛ༁ ϑϨʔζϕʔε౷ܭతػց༁ث .PTFT ͷ ύϥϝʔλνϡʔχϯάޠҎԼͷจ̍̌̌จͰߦ͏ લฤूܕ ಉ࣌ʹ༁͢Δ͜ͱͷޮՌΛௐΔ
ධՁ݁Ռ ༁ਫ਼ ஈ֊ ྲྀெ͞ ஈ֊ ෦తදݱ ͕༁͞Εͯ ͍Δ͔ ϕʔεϥΠϯ
˞ ఏҊख๏ Е ˞ஶऀʹΑΔධՁ