Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
対訳コーパスから生成したワードグラフによる部分的機械翻訳
Search
自然言語処理研究室
March 31, 2013
Research
0
160
対訳コーパスから生成したワードグラフによる部分的機械翻訳
井手上 雅迪. 対訳コーパスから生成したワードグラフによる部分的機械翻訳. 長岡技術科学大学修士論文 (2013.3)
自然言語処理研究室
March 31, 2013
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
360
データサイエンス13_解析.pdf
jnlp
0
420
データサイエンス12_分類.pdf
jnlp
0
310
データサイエンス11_前処理.pdf
jnlp
0
430
Recurrent neural network based language model
jnlp
0
120
自然言語処理研究室 研究概要(2012年)
jnlp
0
110
自然言語処理研究室 研究概要(2013年)
jnlp
0
79
自然言語処理研究室 研究概要(2014年)
jnlp
0
92
自然言語処理研究室 研究概要(2015年)
jnlp
0
150
Other Decks in Research
See All in Research
LLM時代にLabは何をすべきか聞いて回った1年間
hargon24
1
530
snlp2024_multiheadMoE
takase
0
470
Tiaccoon: コンテナネットワークにおいて複数トランスポート方式で統一的なアクセス制御
hiroyaonoe
0
140
marukotenant01/tenant-20240826
marketing2024
0
520
秘伝:脆弱性診断をうまく活用してセキュリティを確保するには
okdt
PRO
4
780
Weekly AI Agents News! 10月号 論文のアーカイブ
masatoto
1
410
尺度開発における質的研究アプローチ(自主企画シンポジウム7:認知行動療法における尺度開発のこれから)
litalicolab
0
360
VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding
sansan_randd
1
350
ソフトウェア研究における脅威モデリング
laysakura
0
960
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
690
論文紹介: COSMO: A Large-Scale E-commerce Common Sense Knowledge Generation and Serving System at Amazon (SIGMOD 2024)
ynakano
1
210
CoRL2024サーベイ
rpc
1
1.1k
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
51
7.3k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
127
18k
For a Future-Friendly Web
brad_frost
175
9.4k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
3
170
Product Roadmaps are Hard
iamctodd
PRO
49
11k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.7k
Visualization
eitanlees
146
15k
How STYLIGHT went responsive
nonsquared
96
5.2k
The Cult of Friendly URLs
andyhume
78
6.1k
Gamification - CAS2011
davidbonilla
80
5.1k
Fireside Chat
paigeccino
34
3.1k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.9k
Transcript
ର༁ίʔύε͔Βੜͨ͠ ϫʔυάϥϑʹΑΔ෦తػց༁ ిؾܥɹࢁຊݚڀࣨ Ҫख্խ
എܠ Ұ෦ใΛམͱͯ͠ྑ͍ͷͰ ͘ਫ਼ͷߴ͍༁͕ཉ͍͠ ༁ΛಡΉϢʔβͷࢹɿ ؒҧ͍ͬͯΔ͔͠Εͳ͍ػց༁Λಡ Ήͷਫ਼ਆతෛ୲ˠ͍ʹ͍͘ ػց༁ͷൃୡ֮͘͠ɺ ۙͰҰ෦ͷ&$αΠτͰ࣮༻Խ͞Ε͍ͯΔ ػց༁ͷग़ྗΤϥʔΛؚΉ
എܠ &$αΠτӡӦऀ͔Βͷࢹɿ ɾ͘ɺਫ਼ͷߴ͍༁ཉ͍͠ ɾͲͷใ͕མͱ͞ΕͯɺͲͷใ͕ Δͷ͔ίϯτϩʔϧͰ͖ͳ͍ͷ ೖྗจɾग़ྗʹͯ͠΄͍͠෦తදݱ ༁ث ೖྗͷҰ෦Λத৺ͱͨ͠༁
త ෦తػց༁ͷఏҊ ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ͓ഽʹ५͍Λ༩͑ɺഽΛ݈͔ʹอͪ·͢ʣ ഽΛ͔͢͜ʹอͭ ࢦఆ͞Εͨ෦తදݱΛத৺ͱͨ͠༁ ෦తදݱɿ5IJTQSPEVDULFFQT
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
ೖྗจ ෦తදݱ ೖྗ ର༁ίʔύε ݪݴޠଆ ग़ྗݴޠଆ ݕࡧ ର༁จू߹ 4 &
ϫʔυάϥϑ࡞ 4 & ̏ ̎ ΤοδॏΈ͚ 4 & ̏ ̎ ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
ఏҊख๏֓ཁ ෦తදݱɿUIJTQSPEVDULFFQT ༩͑ΒΕͨ෦తදݱͰର༁ίʔύεΛݕࡧ ର༁จू߹Λऔಘ ӳޠଆ ର༁จू߹ʢຊޠଆʣ 5IJTQSPEVDULFFQTd ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ 5IJTQSPEVDUdLFFQT ഽΛॊೈͰ͔͢͜ʹอͭ
5IJTQSPEVDULFFQTd ഽΛ͔͢͜ʹอͪ·͢ "MTP UIJTQSPEVDULFFQTd ·ͨɺ͓ഽʹͬ͠ͱΓͱอͪ·͢ ʙ ʙ
ఏҊख๏֓ཁ ର༁จू߹Λ୯ޠׂ ഽΛॊೈʹ͔͢͜ʹอͪΩϝΛ͑Δ ഽΛॊೈͰ͔͢͜ʹอͭ ഽΛ͔͢͜ʹอͪ·͢ ͓ഽʹͬ͠ͱΓͱอͪ·͢ ͓ഽΛอޢ͔͢͜͠ʹอͪ·͢ ֤ޠΛϊʔυɺޠͱޠͷܨ͕ΓΛΤοδͱͯ͠ ϫʔυάϥϑΛ࡞
ఏҊख๏֓ཁ ର༁จू߹͔ΒϫʔυάϥϑΛ࡞ 45"35͔Β&/%·Ͱ ೖྗʹ߹Θͤͨ࠷దͳܦ࿏Λ༁ͱͯ͠ग़ྗ
ೖྗɿ5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ ഽΛ͔͢͜ʹอͭ ఏҊख๏֓ཁ
ఏҊख๏֓ཁ wࠓճӳ༁Λߦ͏ wຊख๏ݴޠඇґଘ w෦తදݱͷநग़ͱର༁จू߹ʹΑΔϫʔ υάϥϑΛ࡞Ͱ͖Ε༁Մೳ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ wΤοδͷॏΈ wϊʔυͷ݁߹
࠷దͳܦ࿏બ ΤοδʹॏΈΛ͚ͭɺ࠷ܦ࿏ͱͯ͠ղ͘ ॏཁΤοδ είΞ ୯ޠ༁֬ είΞ ༁ީิͱ্ͯ͠Ґ̍̑ܦ࿏Λબ͠ɺ ΤοδͷฏۉॏΈͰ࠶ॱҐ͚ Еɿd
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ॏཁΤοδείΞ จू߹Ͱग़ݱස͕ߴ͍΄Ͳ ॏཁͳΤοδͩͱΈͳ͞ΕΔ ಉ͡෦తදݱͰநग़͞Εͨจू߹ʹ ڞ௨ͷදݱ͕ൺֱతߴ͍සͰؚ·ΕΔ
୯ޠ༁֬είΞ *#..PEFMʹΑΔ୯ޠ༁֬Λ༻͍Δ ෦తදݱ͕ಉ͡Ͱ ೖྗจʹΑͬͯ௨Δ͖ϊʔυ͕มԽ͢Δ ೖྗจͷจ຺Λө͢Δ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJOIFBMUIZ ഽΛ͔͢͜ʹอͭ
୯ޠ༁֬είΞ ೖྗɿ5IJTQSPEVDULFFQTZPVSTLJONPJTU ഽΛॊೈʹͬ͠ͱΓͱอͪ·͢
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ wఏҊख๏֓ཁ wܦ࿏બͷํ๏ w֤είΞ wϊʔυͷ݁߹
ϊʔυͷ݁߹ wʮ݈߁ˠతʯͱ͍͏ܦ࿏Λ௨Γͨͯ͘ ϊʔυ͕গͳ͘ͳΔʮॊೈʯΛ௨Ζ͏ͱ͢Δ wϊʔυݮΔʹ͋ΔͨΊɺఆܕදݱ ʹରͯ͠ෆར ʮ݈߁ɹతʯΛ݁߹͍ͨ͠
ϊʔυͷ݁߹ ग़ೖΓ͢ΔΤοδ͕̍ຊ͔͠ͳ͍ϊʔυಉ࢜݁߹
ϊʔυͷ݁߹ ର༁ίʔύεͰߴසͱͳΔޠ·ͱΊΔ ϊʔυͱͯ͠ಛΛ࣋ͨͳ͍
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁࢦඪ wධՁ༻ͷ෦తදݱ wఏҊख๏ͷ࣮ݧ݁Ռ
࣮ݧઃఆ ݈߁৯ؔ࿈ର༁ίʔύε ສର ʹର͠ ӳ༁ dจͷର༁จू߹Λ࣋ͭ෦తදݱͱ ೖྗจͷηοτΛ࡞ จೖྗʹ͏ʣ ͷ෦తදݱΛЕܾఆʹ ͷ෦తදݱΛධՁʹ༻
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ༻෦తදݱ w͋ΔఔಡΊΔΑ͏ͳߏ͕ྑ͍ wධՁऀʹఏࣔ͠ɺ෦తදݱΛத৺ͱ͠ ͨ༁ʹͳ͍ͬͯΔ͔֬ೝͤ͞ΔͨΊ ߏจղੳ݁Ռ͔Β෦తදݱΛࣗಈநग़ ධՁ༻ͷ෦తදݱ
෦తදݱநग़ྫ ղੳ 5IJTQSPEVDUQSPWJEFTZPVSTLJOXJUI NPJTUVSFBOELFFQTJUIFBMUIZ det(product-2, This-1) nsubj(provides-3, product-2) nsubj(keeps-9, product-2)
conj_and(provides-3, keeps-9) nsubj(healthy-11, it-10) xcomp(keeps-9, healthy-11) ʜ EFUOTVCKͱ͍͏ύλʔϯʹ߹க͢Δ 5IJTQSPEVDULFFQTΛநग़
෦తදݱྫ $MJOUPOEFGFBUFE%PMF $MJOUPOEFGFBUFE 5IJTJTDIBSBDUFSJ[FECZVMUSBMJHIUXFJHIUBOEUIJO TMJEJOHBSFBBOEMPOHMFOHUI UIJTJTDIBSBDUFSJ[FE 5PCFVTFEGPSBGUFSCBUIDBSF BTXFMMBTCZUIPTF XJUIDPNCJOBUJPOTLJO TFOTJUJWFTLJO
PSUIFXIPMF GBNJMZ VTFEGPSDBSF
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁج४ w༁ਫ਼ wྲྀெ͞ w෦తදݱ͕༁͞Ε͍ͯΔ͔ ӳޠݍʹ̓ࡏॅ͍ͯͨ͠ຊޠऀʹ ධՁΛґཔ
༁ਫ਼ ग़ྗ݁Ռʹؚ·ΕΔ༰తਖ਼ղͷׂ߹ ஈ֊ධՁ ؒҧͬͨ༰ΛؚΜͰ͍ͳ͍
શʹؒҧ͍ͬͯΔʣ ೖྗจͷใΛશؚͯΜͰ͍ͳͯ͘ߴධՁʹͳΔ͜ͱ͕͋Δ
ྲྀெ͞ ຊޠͱͯ͠ͳ͠ Ұ෦͓͔͍͕͠ͳ͘ಡΊΔ ඇࠃޠత จষͱͯ͠ෆࣗવ ཧղͰ͖ͳ͍ ஈ֊ධՁ ຊޠจͱͯ͠ͷਖ਼͠͞ Ҏ্͋Εेͱ͍͏ج४
෦తදݱ ෦తදݱ͕༁͞Ε͍ͯΔ͔ ෦తදݱΛຊޠԽͨ͠ͷΛఏࣔ ͦͷ༰ؚ͕·Ε͍ͯΕ0 ؚ·Ε͍ͯͳ͚Ε9
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w࣮ݧઃఆ wධՁ༻ͷ෦తදݱ wධՁࢦඪ wఏҊख๏ͷ࣮ݧ݁Ռ
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
ग़ྗจͷఔͷ෦͕ਖ਼͍͠ ྲྀெ̐͞Ҏ্͋Εेͩͱߟ͑Δ
ग़ྗྫ ೖྗɿ8FSFDPNNFOEUIBUZPVDPOTVMUXJUIZPVS EPDUPSJGVTJOHUIFQSPEVDUGPSUIFpSTUUJNF ͡Ίͯͷར༻ͷࡍҩऀʹ૬ஊ͢Δ͜ͱΛ͓͢͢Ί͠·͢ɻ ෦తදݱɿZPVDPOTVMU ͝૬ஊΛ͓͢͢Ί͠·͢ɻ
ग़ྗྫ ೖྗɿ.JOVUFGPBNXBTIFT NPJTUVSJ[FTBOE SFGSFTIZPVSTLJO Ωϝࡉ͔͍๐ཱͪͰ͓ഽΛεοΩϦɺͬ͠ͱΓͱચ্͍͛·͢ɻ ෦తදݱɿGPBNXBTIFT จू߹ͷจɿจ όεύϑɺ;Θ;ΘͷΞϫΛͭ͘Γɺ ༏͘͠แΉΑ͏ʹચ্͍͛·͢ɻ ର༁จू߹͕খ͍͞ͱ̍ϊʔυ͕͘ͳΔ
ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ΛݟΔͱฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ϊʔυ݁߹ํ๏ͷมߋ ର༁จू߹தͰߴසͷޠΛ݁߹
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ༁ਫ਼্͍ͯ͠Δ͕ʢ͕ਖ਼ղʣ ෦త༁Λத৺ͱͨ͠༁ͱͳ͍ͬͯͳ͍ ࢀর༁ͱग़ྗ݁Ռͷ୯ޠͷׂ߹ɿฏۉ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ w݁߹ํ๏ͷมߋ wॏཁϊʔυ௨աͷڧ੍
ॏཁϊʔυ ෦తදݱͱରԠ͢Δϊʔυͷ௨աΛڧ੍ UIJTQSPEVDULFFQT ॊೈ อͪ อͭ ෦తදݱʹର͢Δ୯ޠ༁֬ΛՃࢉɺ ͦͷείΞͰॱҐ͚Δ ʜ
อͪ อͭ ্Ґ̏ϊʔυ ͷ͍ͣΕ͔Λඞͣ௨ա
ධՁ݁Ռ ༁ਫ਼ d ྲྀெ͞ d ෦తදݱ ఏҊख๏ Е
จू߹݁߹ Е ॏཁϊʔυ௨ա ˞ Е ˞ɹൃදऀධՁ ग़ྗจͷఔ͕ਖ਼ղͱͳΔ ͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
·ͱΊ wؒҧ͍ͬͯΔՄೳੑ͕͋Δػց༁ΛಡΉͷਫ਼ਆతෛ ୲ wݪจͷใΛམͱͯ͠ྑ͍ͷͰɺ෦తʹ༁͍ͨ͠ wϫʔυάϥϑΛ༻͍ͨ෦తػց༁ΛఏҊ ɾग़ྗจͷͷ෦͕ਖ਼ղͱ͍͏༁ਫ਼ ɾͷਫ਼Ͱ෦తදݱ͕༁͞ΕΔ
̍ϖʔδ֓ཁ ఏҊख๏ ධՁ ఏҊख๏ͷվળ ·ͱΊ म࢜จൃද·Ͱʹ
म࢜จൃදձ·Ͱʹ wϫʔυάϥϑຖͷ༁݁Ռͷղੳ wϫʔυάϥϑͷߏʹग़ྗ݁Ռ͕େ͖ ͘ґଘ͍ͯ͠Δ wͲͷΑ͏ͳϫʔυάϥϑͩͱ༁ਫ਼ ͕ߴ͍ͷ͔Λௐࠪ wվળࡦͷఏҊ
ϕʔεϥΠϯ ର༁จू߹ͰݪݴޠଆΛར༻ͯ͠จԽ ॏཁΤοδείΞͷΈΛ༻͍Δ จԽ͞ΕͨೖྗจΛ༁ ϑϨʔζϕʔε౷ܭతػց༁ث .PTFT ͷ ύϥϝʔλνϡʔχϯάޠҎԼͷจ̍̌̌จͰߦ͏ લฤूܕ ಉ࣌ʹ༁͢Δ͜ͱͷޮՌΛௐΔ
ධՁ݁Ռ ༁ਫ਼ ஈ֊ ྲྀெ͞ ஈ֊ ෦తදݱ ͕༁͞Εͯ ͍Δ͔ ϕʔεϥΠϯ
˞ ఏҊख๏ Е ˞ஶऀʹΑΔධՁ