Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
対訳コーパスから生成したワードグラフによる部分的機械翻訳
Search
自然言語処理研究室
March 31, 2013
Research
0
170
対訳コーパスから生成したワードグラフによる部分的機械翻訳
井手上 雅迪. 対訳コーパスから生成したワードグラフによる部分的機械翻訳. 長岡技術科学大学修士論文 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
500
データサイエンス12_分類.pdf
jnlp
0
350
データサイエンス11_前処理.pdf
jnlp
0
480
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
130
自然言語処理研究室 研究概要(2015年)
jnlp
0
210
Other Decks in Research
See All in Research
超高速データサイエンス
matsui_528
1
320
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
340
「リアル×スキマ時間」を活用したUXリサーチ 〜新規事業を前に進めるためのUXリサーチプロセスの設計〜
techtekt
PRO
0
180
説明可能な機械学習と数理最適化
kelicht
2
730
SREのためのテレメトリー技術の探究 / Telemetry for SRE
yuukit
13
2.5k
離散凸解析に基づく予測付き離散最適化手法 (IBIS '25)
taihei_oki
PRO
1
630
LLM-jp-3 and beyond: Training Large Language Models
odashi
1
710
AIスパコン「さくらONE」の オブザーバビリティ / Observability for AI Supercomputer SAKURAONE
yuukit
2
1k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
120
LLM-Assisted Semantic Guidance for Sparsely Annotated Remote Sensing Object Detection
satai
3
160
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
210
Sat2City:3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
satai
4
350
Featured
See All Featured
The browser strikes back
jonoalderson
0
55
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
1k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
390
Done Done
chrislema
186
16k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.6k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
Designing for Performance
lara
610
69k
Typedesign – Prime Four
hannesfritz
42
2.9k
Building Applications with DynamoDB
mza
96
6.8k
How to Ace a Technical Interview
jacobian
281
24k
Transcript
ର༁ίʔύε͔Βੜͨ͠ ϫʔυάϥϑʹΑΔ෦తػց༁ ిؾܥɹࢁຊݚڀࣨ Ҫख্խ
എܠ Ұ෦ใΛམͱͯ͠ྑ͍ͷͰ ͘ਫ਼ͷߴ͍༁͕ཉ͍͠ ༁ΛಡΉϢʔβͷࢹɿ ؒҧ͍ͬͯΔ͔͠Εͳ͍ػց༁Λಡ Ήͷਫ਼ਆతෛ୲ˠ͍ʹ͍͘ ػց༁ͷൃୡ֮͘͠ɺ ۙͰҰ෦ͷ&$αΠτͰ࣮༻Խ͞Ε͍ͯΔ ػց༁ͷग़ྗΤϥʔΛؚΉ
എܠ &$αΠτӡӦऀ͔Βͷࢹɿ ɾ͘ɺਫ਼ͷߴ͍༁ཉ͍͠ ɾͲͷใ͕མͱ͞ΕͯɺͲͷใ͕ Δͷ͔ίϯτϩʔϧͰ͖ͳ͍ͷ ೖྗจɾग़ྗʹͯ͠΄͍͠෦తදݱ ༁ث ೖྗͷҰ෦Λத৺ͱͨ͠༁
త ෦తػց༁ͷఏҊ ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ͓ഽʹ५͍Λ༩͑ɺഽΛ݈͔ʹอͪ·͢ʣ ഽΛ͔͢͜ʹอͭ ࢦఆ͞Εͨ෦తදݱΛத৺ͱͨ͠༁ ෦తදݱɿ5IJTQSPEVDULFFQT
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
ೖྗจ ෦తදݱ ೖྗ ର༁ίʔύε ݪݴޠଆ ग़ྗݴޠଆ ݕࡧ ର༁จू߹ 4 &
ϫʔυάϥϑ࡞ 4 & ̏ ̎ ΤοδॏΈ͚ 4 & ̏ ̎ ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
ఏҊख๏֓ཁ ෦తදݱɿUIJTQSPEVDULFFQT ༩͑ΒΕͨ෦తදݱͰର༁ίʔύεΛݕࡧ ର༁จू߹Λऔಘ ӳޠଆ ର༁จू߹ʢຊޠଆʣ 5IJTQSPEVDULFFQTd ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ 5IJTQSPEVDUdLFFQT ഽΛॊೈͰ͔͢͜ʹอͭ
5IJTQSPEVDULFFQTd ഽΛ͔͢͜ʹอͪ·͢ "MTP UIJTQSPEVDULFFQTd ·ͨɺ͓ഽʹͬ͠ͱΓͱอͪ·͢ ʙ ʙ
ఏҊख๏֓ཁ ର༁จू߹Λ୯ޠׂ ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ ഽΛॊೈͰ͔͢͜ʹอͭ ഽΛ͔͢͜ʹอͪ·͢ ͓ഽʹͬ͠ͱΓͱอͪ·͢ ͓ഽΛอޢ͔͢͜͠ʹอͪ·͢ ֤ޠΛϊʔυɺޠͱޠͷܨ͕ΓΛΤοδͱͯ͠ ϫʔυάϥϑΛ࡞
ఏҊख๏֓ཁ ର༁จू߹͔ΒϫʔυάϥϑΛ࡞ 45"35͔Β&/%·Ͱ ೖྗʹ߹Θͤͨ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ഽΛ͔͢͜ʹอͭ ఏҊख๏֓ཁ
ఏҊख๏֓ཁ wࠓճӳ༁Λߦ͏ wຊख๏ݴޠඇґଘ w෦తදݱͷநग़ͱର༁จू߹ʹΑΔϫʔ υάϥϑΛ࡞Ͱ͖Ε༁Մೳ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
࠷దͳܦ࿏બ ΤοδʹॏΈΛ͚ͭɺ࠷ܦ࿏ͱͯ͠ղ͘ ॏཁΤοδ είΞ ୯ޠ༁֬ είΞ ༁ީิͱ্ͯ͠Ґ̍̑ܦ࿏Λબ͠ɺ ΤοδͷฏۉॏΈͰ࠶ॱҐ͚ Еɿd
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ॏཁΤοδείΞ จू߹Ͱग़ݱස͕ߴ͍΄Ͳ ॏཁͳΤοδͩͱΈͳ͞ΕΔ ಉ͡෦తදݱͰநग़͞Εͨจू߹ʹ ڞ௨ͷදݱ͕ൺֱతߴ͍සͰؚ·ΕΔ
୯ޠ༁֬είΞ *#..PEFMʹΑΔ୯ޠ༁֬Λ༻͍Δ ෦తදݱ͕ಉ͡Ͱ ೖྗจʹΑͬͯ௨Δ͖ϊʔυ͕มԽ͢Δ ೖྗจͷจ຺Λө͢Δ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJOIFBMUIZ ഽΛ͔͢͜ʹอͭ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJONPJTU ഽΛॊೈʹͬ͠ͱΓͱอͪ·͢
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ϊʔυͷ݁߹ wʮ݈߁ˠతʯͱ͍͏ܦ࿏Λ௨Γͨͯ͘ ϊʔυ͕গͳ͘ͳΔʮॊೈʯΛ௨Ζ͏ͱ͢Δ wϊʔυݮΔʹ͋ΔͨΊɺఆܕදݱ ʹରͯ͠ෆར ʮ݈߁ɹతʯΛ݁߹͍ͨ͠
ϊʔυͷ݁߹ ग़ೖΓ͢ΔΤοδ͕̍ຊ͔͠ͳ͍ϊʔυಉ࢜݁߹
ϊʔυͷ݁߹ ର༁ίʔύεͰߴසͱͳΔޠ·ͱΊΔ ϊʔυͱͯ͠ಛΛ࣋ͨͳ͍
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁࢦඪ wධՁ༻ͷ෦తදݱ wఏҊख๏ͷ࣮ݧ݁Ռ
࣮ݧઃఆ ݈߁৯ؔ࿈ର༁ίʔύε ສର ʹର͠ ӳ༁ dจͷର༁จू߹Λ࣋ͭ෦తදݱͱ ೖྗจͷηοτΛ࡞ จೖྗʹ͏ʣ ͷ෦తදݱΛЕܾఆʹ ͷ෦తදݱΛධՁʹ༻
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ༻෦తදݱ w͋ΔఔಡΊΔΑ͏ͳߏ͕ྑ͍ wධՁऀʹఏࣔ͠ɺ෦తදݱΛத৺ͱ͠ ͨ༁ʹͳ͍ͬͯΔ͔֬ೝͤ͞ΔͨΊ ߏจղੳ݁Ռ͔Β෦తදݱΛࣗಈநग़ ධՁ༻ͷ෦తදݱ
෦తදݱநग़ྫ ղੳ 5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ det(product-2, This-1) nsubj(provides-3, product-2) nsubj(keeps-9, product-2)
conj_and(provides-3, keeps-9) nsubj(healthy-11, it-10) xcomp(keeps-9, healthy-11) ʜ EFUOTVCKͱ͍͏ύλʔϯʹ߹க͢Δ 5IJTQSPEVDULFFQTΛநग़
෦తදݱྫ $MJOUPOEFGFBUFE%PMF $MJOUPOEFGFBUFE 5IJTJTDIBSBDUFSJ[FECZVMUSBMJHIUXFJHIUBOEUIJO TMJEJOHBSFBBOEMPOHMFOHUI UIJTJTDIBSBDUFSJ[FE 5PCFVTFEGPSBGUFSCBUIDBSF BTXFMMBTCZUIPTF XJUIDPNCJOBUJPOTLJO TFOTJUJWFTLJO
PSUIFXIPMF GBNJMZ VTFEGPSDBSF
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁج४ w༁ਫ਼ wྲྀெ͞ w෦తදݱ͕༁͞Ε͍ͯΔ͔ ӳޠݍʹ̓ࡏॅ͍ͯͨ͠ຊޠऀʹ ධՁΛґཔ
༁ਫ਼ ग़ྗ݁Ռʹؚ·ΕΔ༰తਖ਼ղͷׂ߹ ஈ֊ධՁ ؒҧͬͨ༰ΛؚΜͰ͍ͳ͍
શʹؒҧ͍ͬͯΔʣ ೖྗจͷใΛશؚͯΜͰ͍ͳͯ͘ߴධՁʹͳΔ͜ͱ͕͋Δ
ྲྀெ͞ ຊޠͱͯ͠ͳ͠ Ұ෦͓͔͍͕͠ͳ͘ಡΊΔ ඇࠃޠత จষͱͯ͠ෆࣗવ ཧղͰ͖ͳ͍ ஈ֊ධՁ ຊޠจͱͯ͠ͷਖ਼͠͞ Ҏ্͋Εेͱ͍͏ج४
෦తදݱ ෦తදݱ͕༁͞Ε͍ͯΔ͔ ෦తදݱΛຊޠԽͨ͠ͷΛఏࣔ ͦͷ༰ؚ͕·Ε͍ͯΕ0 ؚ·Ε͍ͯͳ͚Ε9
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
ग़ྗจͷఔͷ෦͕ਖ਼͍͠ ྲྀெ̐͞Ҏ্͋Εेͩͱߟ͑Δ
ग़ྗྫ ೖྗɿ8FSFDPNNFOEUIBUZPVDPOTVMUXJUIZPVS EPDUPSJGVTJOHUIFQSPEVDUGPSUIFpSTUUJNF ͡Ίͯͷར༻ͷࡍҩऀʹ૬ஊ͢Δ͜ͱΛ͓͢͢Ί͠·͢ɻ ෦తදݱɿZPVDPOTVMU ͝૬ஊΛ͓͢͢Ί͠·͢ɻ
ग़ྗྫ ೖྗɿ.JOVUFGPBNXBTIFT NPJTUVSJ[FTBOE SFGSFTIZPVSTLJO Ωϝࡉ͔͍๐ཱͪͰ͓ഽΛεοΩϦɺͬ͠ͱΓͱચ্͍͛·͢ɻ ෦తදݱɿGPBNXBTIFT จू߹ͷจɿจ όεύϑɺ;Θ;ΘͷΞϫΛͭ͘Γɺ ༏͘͠แΉΑ͏ʹચ্͍͛·͢ɻ ର༁จू߹͕খ͍͞ͱ̍ϊʔυ͕͘ͳΔ
ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ΛݟΔͱฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ϊʔυ݁߹ํ๏ͷมߋ ର༁จू߹தͰߴසͷޠΛ݁߹
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ༁ਫ਼্͍ͯ͠Δ͕ʢ͕ਖ਼ղʣ ෦త༁Λத৺ͱͨ͠༁ͱͳ͍ͬͯͳ͍ ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ɿฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ॏཁϊʔυ ෦తදݱͱରԠ͢Δϊʔυͷ௨աΛڧ੍ UIJTQSPEVDULFFQT ॊೈ อͪ อͭ ෦తදݱʹର͢Δ୯ޠ༁֬ΛՃࢉɺ ͦͷείΞͰॱҐ͚Δ ʜ
อͪ อͭ ্Ґ̏ϊʔυ ͷ͍ͣΕ͔Λඞͣ௨ա
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ॏཁϊʔυ௨ա ˞ Е ˞ɹൃදऀධՁ ग़ྗจͷఔ͕ਖ਼ղͱͳΔ ͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
·ͱΊ wؒҧ͍ͬͯΔՄೳੑ͕͋Δػց༁ΛಡΉͷਫ਼ਆతෛ ୲ wݪจͷใΛམͱͯ͠ྑ͍ͷͰɺ෦తʹ༁͍ͨ͠ wϫʔυάϥϑΛ༻͍ͨ෦తػց༁ΛఏҊ ɾग़ྗจͷͷ෦͕ਖ਼ղͱ͍͏༁ਫ਼ ɾͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
म࢜จൃදձ·Ͱʹ wϫʔυάϥϑຖͷ༁݁Ռͷղੳ wϫʔυάϥϑͷߏʹग़ྗ݁Ռ͕େ͖ ͘ґଘ͍ͯ͠Δ wͲͷΑ͏ͳϫʔυάϥϑͩͱ༁ਫ਼ ͕ߴ͍ͷ͔Λௐࠪ wվળࡦͷఏҊ
ϕʔεϥΠϯ ର༁จू߹ͰݪݴޠଆΛར༻ͯ͠จԽ ॏཁΤοδείΞͷΈΛ༻͍Δ จԽ͞ΕͨೖྗจΛ༁ ϑϨʔζϕʔε౷ܭతػց༁ث .PTFT ͷ ύϥϝʔλνϡʔχϯάޠҎԼͷจ̍̌̌จͰߦ͏ લฤूܕ ಉ࣌ʹ༁͢Δ͜ͱͷޮՌΛௐΔ
ධՁ݁Ռ ༁ਫ਼ ஈ֊ ྲྀெ͞ ஈ֊ ෦తදݱ ͕༁͞Εͯ ͍Δ͔ ϕʔεϥΠϯ
˞ ఏҊख๏ Е ˞ஶऀʹΑΔධՁ