Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
対訳コーパスから生成したワードグラフによる部分的機械翻訳
Search
自然言語処理研究室
March 31, 2013
Research
0
160
対訳コーパスから生成したワードグラフによる部分的機械翻訳
井手上 雅迪. 対訳コーパスから生成したワードグラフによる部分的機械翻訳. 長岡技術科学大学修士論文 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
480
データサイエンス12_分類.pdf
jnlp
0
330
データサイエンス11_前処理.pdf
jnlp
0
460
Recurrent neural network based language model
jnlp
0
130
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
93
自然言語処理研究室 研究概要(2014年)
jnlp
0
110
自然言語処理研究室 研究概要(2015年)
jnlp
0
180
Other Decks in Research
See All in Research
心理言語学の視点から再考する言語モデルの学習過程
chemical_tree
2
450
2025年度人工知能学会全国大会チュートリアル講演「深層基盤モデルの数理」
taiji_suzuki
24
16k
データxデジタルマップで拓く ミラノ発・地域共創最前線
mapconcierge4agu
0
190
Large Language Model Agent: A Survey on Methodology, Applications and Challenges
shunk031
13
9k
Self-supervised audiovisual representation learning for remote sensing data
satai
3
230
EOGS: Gaussian Splatting for Efficient Satellite Image Photogrammetry
satai
4
310
20250605_新交通システム推進議連_熊本都市圏「車1割削減、渋滞半減、公共交通2倍」から考える地方都市交通政策
trafficbrain
0
570
Minimax and Bayes Optimal Best-arm Identification: Adaptive Experimental Design for Treatment Choice
masakat0
0
140
20250502_ABEJA_論文読み会_スライド
flatton
0
180
データサイエンティストの採用に関するアンケート
datascientistsociety
PRO
0
1.1k
Computational OT #1 - Monge and Kantorovitch
gpeyre
0
190
Streamlit 総合解説 ~ PythonistaのためのWebアプリ開発 ~
mickey_kubo
1
1.1k
Featured
See All Featured
Raft: Consensus for Rubyists
vanstee
140
7k
Facilitating Awesome Meetings
lara
54
6.5k
Building Applications with DynamoDB
mza
95
6.5k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
990
BBQ
matthewcrist
89
9.7k
Become a Pro
speakerdeck
PRO
29
5.4k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Transcript
ର༁ίʔύε͔Βੜͨ͠ ϫʔυάϥϑʹΑΔ෦తػց༁ ిؾܥɹࢁຊݚڀࣨ Ҫख্խ
എܠ Ұ෦ใΛམͱͯ͠ྑ͍ͷͰ ͘ਫ਼ͷߴ͍༁͕ཉ͍͠ ༁ΛಡΉϢʔβͷࢹɿ ؒҧ͍ͬͯΔ͔͠Εͳ͍ػց༁Λಡ Ήͷਫ਼ਆతෛ୲ˠ͍ʹ͍͘ ػց༁ͷൃୡ֮͘͠ɺ ۙͰҰ෦ͷ&$αΠτͰ࣮༻Խ͞Ε͍ͯΔ ػց༁ͷग़ྗΤϥʔΛؚΉ
എܠ &$αΠτӡӦऀ͔Βͷࢹɿ ɾ͘ɺਫ਼ͷߴ͍༁ཉ͍͠ ɾͲͷใ͕མͱ͞ΕͯɺͲͷใ͕ Δͷ͔ίϯτϩʔϧͰ͖ͳ͍ͷ ೖྗจɾग़ྗʹͯ͠΄͍͠෦తදݱ ༁ث ೖྗͷҰ෦Λத৺ͱͨ͠༁
త ෦తػց༁ͷఏҊ ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ͓ഽʹ५͍Λ༩͑ɺഽΛ݈͔ʹอͪ·͢ʣ ഽΛ͔͢͜ʹอͭ ࢦఆ͞Εͨ෦తදݱΛத৺ͱͨ͠༁ ෦తදݱɿ5IJTQSPEVDULFFQT
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
ೖྗจ ෦తදݱ ೖྗ ର༁ίʔύε ݪݴޠଆ ग़ྗݴޠଆ ݕࡧ ର༁จू߹ 4 &
ϫʔυάϥϑ࡞ 4 & ̏ ̎ ΤοδॏΈ͚ 4 & ̏ ̎ ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
ఏҊख๏֓ཁ ෦తදݱɿUIJTQSPEVDULFFQT ༩͑ΒΕͨ෦తදݱͰର༁ίʔύεΛݕࡧ ର༁จू߹Λऔಘ ӳޠଆ ର༁จू߹ʢຊޠଆʣ 5IJTQSPEVDULFFQTd ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ 5IJTQSPEVDUdLFFQT ഽΛॊೈͰ͔͢͜ʹอͭ
5IJTQSPEVDULFFQTd ഽΛ͔͢͜ʹอͪ·͢ "MTP UIJTQSPEVDULFFQTd ·ͨɺ͓ഽʹͬ͠ͱΓͱอͪ·͢ ʙ ʙ
ఏҊख๏֓ཁ ର༁จू߹Λ୯ޠׂ ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ ഽΛॊೈͰ͔͢͜ʹอͭ ഽΛ͔͢͜ʹอͪ·͢ ͓ഽʹͬ͠ͱΓͱอͪ·͢ ͓ഽΛอޢ͔͢͜͠ʹอͪ·͢ ֤ޠΛϊʔυɺޠͱޠͷܨ͕ΓΛΤοδͱͯ͠ ϫʔυάϥϑΛ࡞
ఏҊख๏֓ཁ ର༁จू߹͔ΒϫʔυάϥϑΛ࡞ 45"35͔Β&/%·Ͱ ೖྗʹ߹Θͤͨ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ഽΛ͔͢͜ʹอͭ ఏҊख๏֓ཁ
ఏҊख๏֓ཁ wࠓճӳ༁Λߦ͏ wຊख๏ݴޠඇґଘ w෦తදݱͷநग़ͱର༁จू߹ʹΑΔϫʔ υάϥϑΛ࡞Ͱ͖Ε༁Մೳ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
࠷దͳܦ࿏બ ΤοδʹॏΈΛ͚ͭɺ࠷ܦ࿏ͱͯ͠ղ͘ ॏཁΤοδ είΞ ୯ޠ༁֬ είΞ ༁ީิͱ্ͯ͠Ґ̍̑ܦ࿏Λબ͠ɺ ΤοδͷฏۉॏΈͰ࠶ॱҐ͚ Еɿd
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ॏཁΤοδείΞ จू߹Ͱग़ݱස͕ߴ͍΄Ͳ ॏཁͳΤοδͩͱΈͳ͞ΕΔ ಉ͡෦తදݱͰநग़͞Εͨจू߹ʹ ڞ௨ͷදݱ͕ൺֱతߴ͍සͰؚ·ΕΔ
୯ޠ༁֬είΞ *#..PEFMʹΑΔ୯ޠ༁֬Λ༻͍Δ ෦తදݱ͕ಉ͡Ͱ ೖྗจʹΑͬͯ௨Δ͖ϊʔυ͕มԽ͢Δ ೖྗจͷจ຺Λө͢Δ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJOIFBMUIZ ഽΛ͔͢͜ʹอͭ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJONPJTU ഽΛॊೈʹͬ͠ͱΓͱอͪ·͢
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ϊʔυͷ݁߹ wʮ݈߁ˠతʯͱ͍͏ܦ࿏Λ௨Γͨͯ͘ ϊʔυ͕গͳ͘ͳΔʮॊೈʯΛ௨Ζ͏ͱ͢Δ wϊʔυݮΔʹ͋ΔͨΊɺఆܕදݱ ʹରͯ͠ෆར ʮ݈߁ɹతʯΛ݁߹͍ͨ͠
ϊʔυͷ݁߹ ग़ೖΓ͢ΔΤοδ͕̍ຊ͔͠ͳ͍ϊʔυಉ࢜݁߹
ϊʔυͷ݁߹ ର༁ίʔύεͰߴසͱͳΔޠ·ͱΊΔ ϊʔυͱͯ͠ಛΛ࣋ͨͳ͍
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁࢦඪ wධՁ༻ͷ෦తදݱ wఏҊख๏ͷ࣮ݧ݁Ռ
࣮ݧઃఆ ݈߁৯ؔ࿈ର༁ίʔύε ສର ʹର͠ ӳ༁ dจͷର༁จू߹Λ࣋ͭ෦తදݱͱ ೖྗจͷηοτΛ࡞ จೖྗʹ͏ʣ ͷ෦తදݱΛЕܾఆʹ ͷ෦తදݱΛධՁʹ༻
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ༻෦తදݱ w͋ΔఔಡΊΔΑ͏ͳߏ͕ྑ͍ wධՁऀʹఏࣔ͠ɺ෦తදݱΛத৺ͱ͠ ͨ༁ʹͳ͍ͬͯΔ͔֬ೝͤ͞ΔͨΊ ߏจղੳ݁Ռ͔Β෦తදݱΛࣗಈநग़ ධՁ༻ͷ෦తදݱ
෦తදݱநग़ྫ ղੳ 5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ det(product-2, This-1) nsubj(provides-3, product-2) nsubj(keeps-9, product-2)
conj_and(provides-3, keeps-9) nsubj(healthy-11, it-10) xcomp(keeps-9, healthy-11) ʜ EFUOTVCKͱ͍͏ύλʔϯʹ߹க͢Δ 5IJTQSPEVDULFFQTΛநग़
෦తදݱྫ $MJOUPOEFGFBUFE%PMF $MJOUPOEFGFBUFE 5IJTJTDIBSBDUFSJ[FECZVMUSBMJHIUXFJHIUBOEUIJO TMJEJOHBSFBBOEMPOHMFOHUI UIJTJTDIBSBDUFSJ[FE 5PCFVTFEGPSBGUFSCBUIDBSF BTXFMMBTCZUIPTF XJUIDPNCJOBUJPOTLJO TFOTJUJWFTLJO
PSUIFXIPMF GBNJMZ VTFEGPSDBSF
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁج४ w༁ਫ਼ wྲྀெ͞ w෦తදݱ͕༁͞Ε͍ͯΔ͔ ӳޠݍʹ̓ࡏॅ͍ͯͨ͠ຊޠऀʹ ධՁΛґཔ
༁ਫ਼ ग़ྗ݁Ռʹؚ·ΕΔ༰తਖ਼ղͷׂ߹ ஈ֊ධՁ ؒҧͬͨ༰ΛؚΜͰ͍ͳ͍
શʹؒҧ͍ͬͯΔʣ ೖྗจͷใΛશؚͯΜͰ͍ͳͯ͘ߴධՁʹͳΔ͜ͱ͕͋Δ
ྲྀெ͞ ຊޠͱͯ͠ͳ͠ Ұ෦͓͔͍͕͠ͳ͘ಡΊΔ ඇࠃޠత จষͱͯ͠ෆࣗવ ཧղͰ͖ͳ͍ ஈ֊ධՁ ຊޠจͱͯ͠ͷਖ਼͠͞ Ҏ্͋Εेͱ͍͏ج४
෦తදݱ ෦తදݱ͕༁͞Ε͍ͯΔ͔ ෦తදݱΛຊޠԽͨ͠ͷΛఏࣔ ͦͷ༰ؚ͕·Ε͍ͯΕ0 ؚ·Ε͍ͯͳ͚Ε9
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
ग़ྗจͷఔͷ෦͕ਖ਼͍͠ ྲྀெ̐͞Ҏ্͋Εेͩͱߟ͑Δ
ग़ྗྫ ೖྗɿ8FSFDPNNFOEUIBUZPVDPOTVMUXJUIZPVS EPDUPSJGVTJOHUIFQSPEVDUGPSUIFpSTUUJNF ͡Ίͯͷར༻ͷࡍҩऀʹ૬ஊ͢Δ͜ͱΛ͓͢͢Ί͠·͢ɻ ෦తදݱɿZPVDPOTVMU ͝૬ஊΛ͓͢͢Ί͠·͢ɻ
ग़ྗྫ ೖྗɿ.JOVUFGPBNXBTIFT NPJTUVSJ[FTBOE SFGSFTIZPVSTLJO Ωϝࡉ͔͍๐ཱͪͰ͓ഽΛεοΩϦɺͬ͠ͱΓͱચ্͍͛·͢ɻ ෦తදݱɿGPBNXBTIFT จू߹ͷจɿจ όεύϑɺ;Θ;ΘͷΞϫΛͭ͘Γɺ ༏͘͠แΉΑ͏ʹચ্͍͛·͢ɻ ର༁จू߹͕খ͍͞ͱ̍ϊʔυ͕͘ͳΔ
ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ΛݟΔͱฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ϊʔυ݁߹ํ๏ͷมߋ ର༁จू߹தͰߴසͷޠΛ݁߹
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ༁ਫ਼্͍ͯ͠Δ͕ʢ͕ਖ਼ղʣ ෦త༁Λத৺ͱͨ͠༁ͱͳ͍ͬͯͳ͍ ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ɿฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ॏཁϊʔυ ෦తදݱͱରԠ͢Δϊʔυͷ௨աΛڧ੍ UIJTQSPEVDULFFQT ॊೈ อͪ อͭ ෦తදݱʹର͢Δ୯ޠ༁֬ΛՃࢉɺ ͦͷείΞͰॱҐ͚Δ ʜ
อͪ อͭ ্Ґ̏ϊʔυ ͷ͍ͣΕ͔Λඞͣ௨ա
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ॏཁϊʔυ௨ա ˞ Е ˞ɹൃදऀධՁ ग़ྗจͷఔ͕ਖ਼ղͱͳΔ ͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
·ͱΊ wؒҧ͍ͬͯΔՄೳੑ͕͋Δػց༁ΛಡΉͷਫ਼ਆతෛ ୲ wݪจͷใΛམͱͯ͠ྑ͍ͷͰɺ෦తʹ༁͍ͨ͠ wϫʔυάϥϑΛ༻͍ͨ෦తػց༁ΛఏҊ ɾग़ྗจͷͷ෦͕ਖ਼ղͱ͍͏༁ਫ਼ ɾͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
म࢜จൃදձ·Ͱʹ wϫʔυάϥϑຖͷ༁݁Ռͷղੳ wϫʔυάϥϑͷߏʹग़ྗ݁Ռ͕େ͖ ͘ґଘ͍ͯ͠Δ wͲͷΑ͏ͳϫʔυάϥϑͩͱ༁ਫ਼ ͕ߴ͍ͷ͔Λௐࠪ wվળࡦͷఏҊ
ϕʔεϥΠϯ ର༁จू߹ͰݪݴޠଆΛར༻ͯ͠จԽ ॏཁΤοδείΞͷΈΛ༻͍Δ จԽ͞ΕͨೖྗจΛ༁ ϑϨʔζϕʔε౷ܭతػց༁ث .PTFT ͷ ύϥϝʔλνϡʔχϯάޠҎԼͷจ̍̌̌จͰߦ͏ લฤूܕ ಉ࣌ʹ༁͢Δ͜ͱͷޮՌΛௐΔ
ධՁ݁Ռ ༁ਫ਼ ஈ֊ ྲྀெ͞ ஈ֊ ෦తදݱ ͕༁͞Εͯ ͍Δ͔ ϕʔεϥΠϯ
˞ ఏҊख๏ Е ˞ஶऀʹΑΔධՁ