Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
対訳コーパスから生成したワードグラフによる部分的機械翻訳
Search
自然言語処理研究室
March 31, 2013
Research
0
160
対訳コーパスから生成したワードグラフによる部分的機械翻訳
井手上 雅迪. 対訳コーパスから生成したワードグラフによる部分的機械翻訳. 長岡技術科学大学修士論文 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
480
データサイエンス12_分類.pdf
jnlp
0
340
データサイエンス11_前処理.pdf
jnlp
0
460
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
97
自然言語処理研究室 研究概要(2014年)
jnlp
0
120
自然言語処理研究室 研究概要(2015年)
jnlp
0
190
Other Decks in Research
See All in Research
20250725-bet-ai-day
cipepser
2
420
VectorLLM: Human-like Extraction of Structured Building Contours via Multimodal LLMs
satai
4
210
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
0
160
生成的推薦の人気バイアスの分析:暗記の観点から / JSAI2025
upura
0
260
一人称視点映像解析の最先端(MIRU2025 チュートリアル)
takumayagi
6
3.5k
Time to Cash: The Full Stack Breakdown of Modern ATM Attacks
ratatata
0
130
国際論文を出そう!ICRA / IROS / RA-L への論文投稿の心構えとノウハウ / RSJ2025 Luncheon Seminar
koide3
6
4.6k
在庫管理のための機械学習と最適化の融合
mickey_kubo
3
1.1k
2025年度人工知能学会全国大会チュートリアル講演「深層基盤モデルの数理」
taiji_suzuki
25
18k
Stealing LUKS Keys via TPM and UUID Spoofing in 10 Minutes - BSides 2025
anykeyshik
0
110
MIRU2025 チュートリアル講演「ロボット基盤モデルの最前線」
haraduka
15
7.9k
Mechanistic Interpretability:解釈可能性研究の新たな潮流
koshiro_aoki
1
410
Featured
See All Featured
Typedesign – Prime Four
hannesfritz
42
2.8k
A Tale of Four Properties
chriscoyier
160
23k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.4k
The Language of Interfaces
destraynor
161
25k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Documentation Writing (for coders)
carmenintech
74
5k
Making Projects Easy
brettharned
117
6.4k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The Power of CSS Pseudo Elements
geoffreycrofte
77
6k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
810
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
36
2.5k
Transcript
ର༁ίʔύε͔Βੜͨ͠ ϫʔυάϥϑʹΑΔ෦తػց༁ ిؾܥɹࢁຊݚڀࣨ Ҫख্խ
എܠ Ұ෦ใΛམͱͯ͠ྑ͍ͷͰ ͘ਫ਼ͷߴ͍༁͕ཉ͍͠ ༁ΛಡΉϢʔβͷࢹɿ ؒҧ͍ͬͯΔ͔͠Εͳ͍ػց༁Λಡ Ήͷਫ਼ਆతෛ୲ˠ͍ʹ͍͘ ػց༁ͷൃୡ֮͘͠ɺ ۙͰҰ෦ͷ&$αΠτͰ࣮༻Խ͞Ε͍ͯΔ ػց༁ͷग़ྗΤϥʔΛؚΉ
എܠ &$αΠτӡӦऀ͔Βͷࢹɿ ɾ͘ɺਫ਼ͷߴ͍༁ཉ͍͠ ɾͲͷใ͕མͱ͞ΕͯɺͲͷใ͕ Δͷ͔ίϯτϩʔϧͰ͖ͳ͍ͷ ೖྗจɾग़ྗʹͯ͠΄͍͠෦తදݱ ༁ث ೖྗͷҰ෦Λத৺ͱͨ͠༁
త ෦తػց༁ͷఏҊ ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ͓ഽʹ५͍Λ༩͑ɺഽΛ݈͔ʹอͪ·͢ʣ ഽΛ͔͢͜ʹอͭ ࢦఆ͞Εͨ෦తදݱΛத৺ͱͨ͠༁ ෦తදݱɿ5IJTQSPEVDULFFQT
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
ೖྗจ ෦తදݱ ೖྗ ର༁ίʔύε ݪݴޠଆ ग़ྗݴޠଆ ݕࡧ ର༁จू߹ 4 &
ϫʔυάϥϑ࡞ 4 & ̏ ̎ ΤοδॏΈ͚ 4 & ̏ ̎ ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
ఏҊख๏֓ཁ ෦తදݱɿUIJTQSPEVDULFFQT ༩͑ΒΕͨ෦తදݱͰର༁ίʔύεΛݕࡧ ର༁จू߹Λऔಘ ӳޠଆ ର༁จू߹ʢຊޠଆʣ 5IJTQSPEVDULFFQTd ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ 5IJTQSPEVDUdLFFQT ഽΛॊೈͰ͔͢͜ʹอͭ
5IJTQSPEVDULFFQTd ഽΛ͔͢͜ʹอͪ·͢ "MTP UIJTQSPEVDULFFQTd ·ͨɺ͓ഽʹͬ͠ͱΓͱอͪ·͢ ʙ ʙ
ఏҊख๏֓ཁ ର༁จू߹Λ୯ޠׂ ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ ഽΛॊೈͰ͔͢͜ʹอͭ ഽΛ͔͢͜ʹอͪ·͢ ͓ഽʹͬ͠ͱΓͱอͪ·͢ ͓ഽΛอޢ͔͢͜͠ʹอͪ·͢ ֤ޠΛϊʔυɺޠͱޠͷܨ͕ΓΛΤοδͱͯ͠ ϫʔυάϥϑΛ࡞
ఏҊख๏֓ཁ ର༁จू߹͔ΒϫʔυάϥϑΛ࡞ 45"35͔Β&/%·Ͱ ೖྗʹ߹Θͤͨ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ഽΛ͔͢͜ʹอͭ ఏҊख๏֓ཁ
ఏҊख๏֓ཁ wࠓճӳ༁Λߦ͏ wຊख๏ݴޠඇґଘ w෦తදݱͷநग़ͱର༁จू߹ʹΑΔϫʔ υάϥϑΛ࡞Ͱ͖Ε༁Մೳ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
࠷దͳܦ࿏બ ΤοδʹॏΈΛ͚ͭɺ࠷ܦ࿏ͱͯ͠ղ͘ ॏཁΤοδ είΞ ୯ޠ༁֬ είΞ ༁ީิͱ্ͯ͠Ґ̍̑ܦ࿏Λબ͠ɺ ΤοδͷฏۉॏΈͰ࠶ॱҐ͚ Еɿd
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ॏཁΤοδείΞ จू߹Ͱग़ݱස͕ߴ͍΄Ͳ ॏཁͳΤοδͩͱΈͳ͞ΕΔ ಉ͡෦తදݱͰநग़͞Εͨจू߹ʹ ڞ௨ͷදݱ͕ൺֱతߴ͍සͰؚ·ΕΔ
୯ޠ༁֬είΞ *#..PEFMʹΑΔ୯ޠ༁֬Λ༻͍Δ ෦తදݱ͕ಉ͡Ͱ ೖྗจʹΑͬͯ௨Δ͖ϊʔυ͕มԽ͢Δ ೖྗจͷจ຺Λө͢Δ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJOIFBMUIZ ഽΛ͔͢͜ʹอͭ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJONPJTU ഽΛॊೈʹͬ͠ͱΓͱอͪ·͢
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ϊʔυͷ݁߹ wʮ݈߁ˠతʯͱ͍͏ܦ࿏Λ௨Γͨͯ͘ ϊʔυ͕গͳ͘ͳΔʮॊೈʯΛ௨Ζ͏ͱ͢Δ wϊʔυݮΔʹ͋ΔͨΊɺఆܕදݱ ʹରͯ͠ෆར ʮ݈߁ɹతʯΛ݁߹͍ͨ͠
ϊʔυͷ݁߹ ग़ೖΓ͢ΔΤοδ͕̍ຊ͔͠ͳ͍ϊʔυಉ࢜݁߹
ϊʔυͷ݁߹ ର༁ίʔύεͰߴසͱͳΔޠ·ͱΊΔ ϊʔυͱͯ͠ಛΛ࣋ͨͳ͍
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁࢦඪ wධՁ༻ͷ෦తදݱ wఏҊख๏ͷ࣮ݧ݁Ռ
࣮ݧઃఆ ݈߁৯ؔ࿈ର༁ίʔύε ສର ʹର͠ ӳ༁ dจͷର༁จू߹Λ࣋ͭ෦తදݱͱ ೖྗจͷηοτΛ࡞ จೖྗʹ͏ʣ ͷ෦తදݱΛЕܾఆʹ ͷ෦తදݱΛධՁʹ༻
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ༻෦తදݱ w͋ΔఔಡΊΔΑ͏ͳߏ͕ྑ͍ wධՁऀʹఏࣔ͠ɺ෦తදݱΛத৺ͱ͠ ͨ༁ʹͳ͍ͬͯΔ͔֬ೝͤ͞ΔͨΊ ߏจղੳ݁Ռ͔Β෦తදݱΛࣗಈநग़ ධՁ༻ͷ෦తදݱ
෦తදݱநग़ྫ ղੳ 5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ det(product-2, This-1) nsubj(provides-3, product-2) nsubj(keeps-9, product-2)
conj_and(provides-3, keeps-9) nsubj(healthy-11, it-10) xcomp(keeps-9, healthy-11) ʜ EFUOTVCKͱ͍͏ύλʔϯʹ߹க͢Δ 5IJTQSPEVDULFFQTΛநग़
෦తදݱྫ $MJOUPOEFGFBUFE%PMF $MJOUPOEFGFBUFE 5IJTJTDIBSBDUFSJ[FECZVMUSBMJHIUXFJHIUBOEUIJO TMJEJOHBSFBBOEMPOHMFOHUI UIJTJTDIBSBDUFSJ[FE 5PCFVTFEGPSBGUFSCBUIDBSF BTXFMMBTCZUIPTF XJUIDPNCJOBUJPOTLJO TFOTJUJWFTLJO
PSUIFXIPMF GBNJMZ VTFEGPSDBSF
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁج४ w༁ਫ਼ wྲྀெ͞ w෦తදݱ͕༁͞Ε͍ͯΔ͔ ӳޠݍʹ̓ࡏॅ͍ͯͨ͠ຊޠऀʹ ධՁΛґཔ
༁ਫ਼ ग़ྗ݁Ռʹؚ·ΕΔ༰తਖ਼ղͷׂ߹ ஈ֊ධՁ ؒҧͬͨ༰ΛؚΜͰ͍ͳ͍
શʹؒҧ͍ͬͯΔʣ ೖྗจͷใΛશؚͯΜͰ͍ͳͯ͘ߴධՁʹͳΔ͜ͱ͕͋Δ
ྲྀெ͞ ຊޠͱͯ͠ͳ͠ Ұ෦͓͔͍͕͠ͳ͘ಡΊΔ ඇࠃޠత จষͱͯ͠ෆࣗવ ཧղͰ͖ͳ͍ ஈ֊ධՁ ຊޠจͱͯ͠ͷਖ਼͠͞ Ҏ্͋Εेͱ͍͏ج४
෦తදݱ ෦తදݱ͕༁͞Ε͍ͯΔ͔ ෦తදݱΛຊޠԽͨ͠ͷΛఏࣔ ͦͷ༰ؚ͕·Ε͍ͯΕ0 ؚ·Ε͍ͯͳ͚Ε9
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
ग़ྗจͷఔͷ෦͕ਖ਼͍͠ ྲྀெ̐͞Ҏ্͋Εेͩͱߟ͑Δ
ग़ྗྫ ೖྗɿ8FSFDPNNFOEUIBUZPVDPOTVMUXJUIZPVS EPDUPSJGVTJOHUIFQSPEVDUGPSUIFpSTUUJNF ͡Ίͯͷར༻ͷࡍҩऀʹ૬ஊ͢Δ͜ͱΛ͓͢͢Ί͠·͢ɻ ෦తදݱɿZPVDPOTVMU ͝૬ஊΛ͓͢͢Ί͠·͢ɻ
ग़ྗྫ ೖྗɿ.JOVUFGPBNXBTIFT NPJTUVSJ[FTBOE SFGSFTIZPVSTLJO Ωϝࡉ͔͍๐ཱͪͰ͓ഽΛεοΩϦɺͬ͠ͱΓͱચ্͍͛·͢ɻ ෦తදݱɿGPBNXBTIFT จू߹ͷจɿจ όεύϑɺ;Θ;ΘͷΞϫΛͭ͘Γɺ ༏͘͠แΉΑ͏ʹચ্͍͛·͢ɻ ର༁จू߹͕খ͍͞ͱ̍ϊʔυ͕͘ͳΔ
ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ΛݟΔͱฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ϊʔυ݁߹ํ๏ͷมߋ ର༁จू߹தͰߴසͷޠΛ݁߹
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ༁ਫ਼্͍ͯ͠Δ͕ʢ͕ਖ਼ղʣ ෦త༁Λத৺ͱͨ͠༁ͱͳ͍ͬͯͳ͍ ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ɿฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ॏཁϊʔυ ෦తදݱͱରԠ͢Δϊʔυͷ௨աΛڧ੍ UIJTQSPEVDULFFQT ॊೈ อͪ อͭ ෦తදݱʹର͢Δ୯ޠ༁֬ΛՃࢉɺ ͦͷείΞͰॱҐ͚Δ ʜ
อͪ อͭ ্Ґ̏ϊʔυ ͷ͍ͣΕ͔Λඞͣ௨ա
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ॏཁϊʔυ௨ա ˞ Е ˞ɹൃදऀධՁ ग़ྗจͷఔ͕ਖ਼ղͱͳΔ ͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
·ͱΊ wؒҧ͍ͬͯΔՄೳੑ͕͋Δػց༁ΛಡΉͷਫ਼ਆతෛ ୲ wݪจͷใΛམͱͯ͠ྑ͍ͷͰɺ෦తʹ༁͍ͨ͠ wϫʔυάϥϑΛ༻͍ͨ෦తػց༁ΛఏҊ ɾग़ྗจͷͷ෦͕ਖ਼ղͱ͍͏༁ਫ਼ ɾͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
म࢜จൃදձ·Ͱʹ wϫʔυάϥϑຖͷ༁݁Ռͷղੳ wϫʔυάϥϑͷߏʹग़ྗ݁Ռ͕େ͖ ͘ґଘ͍ͯ͠Δ wͲͷΑ͏ͳϫʔυάϥϑͩͱ༁ਫ਼ ͕ߴ͍ͷ͔Λௐࠪ wվળࡦͷఏҊ
ϕʔεϥΠϯ ର༁จू߹ͰݪݴޠଆΛར༻ͯ͠จԽ ॏཁΤοδείΞͷΈΛ༻͍Δ จԽ͞ΕͨೖྗจΛ༁ ϑϨʔζϕʔε౷ܭతػց༁ث .PTFT ͷ ύϥϝʔλνϡʔχϯάޠҎԼͷจ̍̌̌จͰߦ͏ લฤूܕ ಉ࣌ʹ༁͢Δ͜ͱͷޮՌΛௐΔ
ධՁ݁Ռ ༁ਫ਼ ஈ֊ ྲྀெ͞ ஈ֊ ෦తදݱ ͕༁͞Εͯ ͍Δ͔ ϕʔεϥΠϯ
˞ ఏҊख๏ Е ˞ஶऀʹΑΔධՁ