Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis

௕ Ԭ ٕ ज़ Պ ֶ େ ֶ ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ ֶ ෦ ̐ ೥ ֯ ு ཽ ੖ Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis Daisuke Kawahara and Yuta Hayashibe and Hajime Morita and Sadao Kurohashi Proceedings of the 15th International Conference on Parsing Technologies, pages 1–10, Pisa, Italy; September 20–22, 2017. ਤ΍ද͸࿦จΑΓҾ༻ 1

概要 2 ˗ఏҊ   ࣗಈతʹ֫ಘ͞Εͨޠኮ஌ࣝʹجͮ͘ܗଶૉղੳٴ ͼ܎Γड͚ղੳͷڞಉϞσϧͷఏҊ ˗݁Ռ   ैདྷͷύΠϓϥΠϯϞσϧΑΓ΋ڞಉϞσϧͷ༗ޮ
ੑΛূ໌

はじめに 3   ηάϝϯτԽ͞Ε͍ͯͳ͍ݴޠͷղੳ ܗଶૉղੳ ୯ޠ෼ׂɺ104෇͚ɺݟग़͠ޠղੳ
Ὃ ܎Γड͚ղੳ΍ड़ޠҾ਺ߏ଄ 1"4 ղੳͳͲ   ύΠϓϥΠϯॲཧͷ໰୊ ¡  ܗଶૉղੳͷΤϥʔ͕ޙଓͷղੳʹ఻ൖ͢Δ ὎ܗଶૉղੳͰ୯ޠ෼ׂΛ͢Δࡍʹɺߏจతٴͼߏ଄తͳ஌ࣝ ͕ඞཁͳ৔߹͕͋Δɻ

はじめに 4 Մೳੑɹ͕ɹ͋Δ͔ͳ͍ɹ͔ɹ෼͔Βɹͳ͍ ˓B ͋Δ͔ͳ͍ FYJTUPSOPU
὎Մೳੑ͕͋Δ͔Ͳ͏͔ ɹ C ͋Δ͔ͳ͍ XBMLOPU ὎Մೳੑ͕า͔ͳ͍

提案 5   ࣗಈతʹ֫ಘͨ͠ޠኮ஌ࣝʹجͮ͘ɺ ɹܗଶૉɾ܎Γड͚ղੳͷڞಉϞσϧΛఏҊ͢Δɻ   ޠኮ஌ࣝʹ͸̏ͭͷλΠϓ͕͋Δ ¡  ֨ϑϨʔϜ
¡  ໊ࢺͱड़ޠͷ܎Γड͚ؔ܎ͷڞى֬཰ ¡  ୯ޠຒΊࠐΈ ಛʹɺ֨ϑϨʔϜ͸ɺܗଶతɾߏจతͳᐆດੑΛղফ ͢Δͷʹ༗ޮͳख͕͔Γɻ

関連研究 6   ϔϒϥΠޠͱΞϥϏΞޠͰϥςΟεղੳ๏͕ఏҊ ¡  (PMECFSHBOE5TBSGBSZ ¡  (PMECFSHFUBM
¡  (SFFOBOE.BOOJOH ¡  (PMECFSHBOE&MIBEBE   ޠኮ஌ࣝͳ͠ͷڞಉղੳϞσϧΛఏҊ ¡  5BXBSBFUBM

格フレーム 7   ֨ϑϨʔϜΛ࢖༻ͯ͠ɺ1"4ͷଥ౰ੑΛධՁ͢Δ   ֨ϑϨʔϜ͸,BXBIBSBFUBM ͷߏஙํ๏Λద༻  
ܗଶૉղੳͱ܎Γड͚ղੳ +6." ͱ,/1 Λੜίʔύεʹద༻ ͢Δɻ ὎ΤϥʔͷӨڹ؇࿨ͷͨΊɺᐆດੑͷͳ͍৴པੑͷߴ͍1"4ͷΈΛந ग़   ಉ͡ҙຯΛ࣋ͭ1"4Λड़ޠͱ࠷΋͍ۙҾ਺Λ݁߹ࣝ͠ผ͢Δɻ ὎ྫ͑͹ɺʮಓΛา͘ʯͱʮொΛา͘ʯͳͲͷड़ޠҾ਺ͷ૊Ͱ۠ผ͢ Δɻ ԯͷ೔ຊޠจ὎ड़ޠ ໿ ͷ֨ϑϨʔϜΛऔಘ

名詞と述語の依存関係の共起確率 8   1"4Ͱଊ͑ΒΕͳ͍܎Γड͚ؔ܎ΛධՁ͢Δ   ܎Γड͚ؔ܎ͷڞى֬཰ͷ౷ܭ೔ຊޠ8FCίʔύε ͷԯจ͔Βऔಘ͢Δ ¡  ໊ࢺ໊ࢺ ÷ 
ෳ߹໊ࢺΛؚΉ໊ࢺؒͷґଘؔ܎ΛΧόʔ ¡  ड़ޠड़ޠ ÷  ड़ޠؒͷґଘؔ܎ΛΧόʔ

単語埋め込み 9   ୯ޠͱ୯ޠྻͷؒͷྨࣅ౓Λܭࢉ͢Δ   XPSEWFD .JLPMPWFUBM ʹΑͬͯɺԯͷ ೔ຊޠͷ8FCจΛ࢖༻ͯ͠܇࿅͢Δ
¡  ࣍ݩ਺ͰDPTྨࣅ౓Λܭࢉ͢Δ

共同解析モデル 10   $,:ΞϧΰϦζϜΛ࠾༻ ¡  ڞಉղੳϞσϧʹ޿͘࢖༻͞Ε͍ͯΔ   ͜ͷϞσϧͷग़ྗ ¡  ୯ޠɺจઅɺٴͼ܎Γड͚ؔ܎ͷશͯͷ໌֬ͳ݁ՌΛؚΉɺ
ɹ࠷దͳղੳπϦʔΛग़ྗ

共同解析モデルの解析手順 11   ީิ୯ޠͷ$,:ςʔϒϧ΁ͷ౤Ө ¡  ܗଶૉղੳΛ༻͍ͯɺ୯ޠ֨ࢠΛੜ੒͢Δ   ޠ۟ͷੜ੒ ¡ 
104ϕʔεͷޠ۟ͷմͷنଇΛ ɹ࢖༻͠$,:ςʔϒϧͰੜ੒͞ΕΔ ὎ϧʔϧ͸,/1͔Βநग़͞ΕΔ ¡  ࠷খͷαϒπϦʔͱͯ͠Έͳ͢

共同解析モデルの解析手順 12   ྡ઀͢ΔαϒπϦʔϖΞͷϚʔδ ¡  ྡ઀͢ΔαϒπϦʔΛϚʔδ͠ɺ ɹ৽͍͠αϒπϦʔΛੜ੒ ¡  ϘτϧΞοϓํࣜͰߦ͏
὎ೖྗจશମʹର͢Δީิ໦

共同解析モデルの解析手順 13   είΞ͕࠷΋ߴ͍πϦʔΛબ୒ ੜ੒͞Εͨީิ໦ͷதͰείΞ͕࠷΋ߴ͍໦Λग़ྗ

スコア機能とトレーニング 14   είΞػೳ
XJ ɿಛ௃ͷॏΈ ЇJ ɿಛ௃Jͷಛ௃ؔ਺   ֶशखॱ   ಛ௃ྔΛॳظԽ͠ɺ܇࿅ίʔύε಺ͷ֤จͷ୯ޠ֨ࢠ Λೖྗ   ೖྗจʹର͢Δީิ໦ΛಘΔ   ΰʔϧυπϦʔʹର͢Δ܎Γड͚είΞ͕࠷΋ߴ͍π ϦʔΛਖ਼ͷΠϯελϯεͱ͢Δ ಛ௃ͷॏΈ͸܇࿅ίʔύε಺ͷશͯͷจ͔Β࠷దԽ͞ΕΔɻ

実験 15   ژ౎େֶςΩετίʔύε /&84 ¡  ,BXBIBSBFUBM  
ژ౎େֶ΢ΣϒจॻϦʔυίʔύε 8&# ¡  )BOHZPFUBM

実験 16   ൺֱର৅ ¡  ,/1 ,BXBIBSBBOE,VSPIBTIJ ¡ 
$BCP$IB 4BTTBOP   ධՁ߲໨ ¡  4FHɿ୯ޠ෼ׂ ¡  104ɿ4FH 104 ¡  "MMɿ4FH 104 ͖Ίࡉ͔͍104 جຊܗ ¡  Q4FRɿจઅ۠੾Γ ¡  6"4-"4ɿϥϕϧͳ͠ϥϕϧ͋Γͷ܎Γड͚ղੳ

実験結果 17

実験結果 18

結論 19   ࣗಈ֫ಘͨ͠ޠኮ஌ࣝʹجͮ͘ɺܗଶૉղੳٴͼ܎ Γड͚ղੳͷڞಉϞσϧͷఏҊ   ैདྷͷύΠϓϥΠϯϞσϧʹൺ΂ɺڞಉϞσϧͷ༗ ޮੑΛࣔͨ͠   ܗଶૉղੳͱ܎Γड͚ղੳͷͨΊͷޠኮ஌ࣝΛ
χϡʔϥϧωοτϫʔΫϕʔεϞσϧʹ૊ΈࠐΉ͜ ͱʹࢼΈΔ

Automatically Acquired Lexical Knowledge Improv...

Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis

kakubari

More Decks by kakubari

Other Decks in Technology

Featured

Transcript

概要 2 ˗ఏҊ   ࣗಈతʹ֫ಘ͞Εͨޠኮ஌ࣝʹجͮ͘ܗଶૉղੳٴ ͼ܎Γड͚ղੳͷڞಉϞσϧͷఏҊ ˗݁Ռ   ैདྷͷύΠϓϥΠϯϞσϧΑΓ΋ڞಉϞσϧͷ༗ޮ

はじめに 3   ηάϝϯτԽ͞Ε͍ͯͳ͍ݴޠͷղੳ ܗଶૉղੳ ୯ޠ෼ׂɺ104෇͚ɺݟग़͠ޠղੳ

はじめに 4 Մೳੑɹ͕ɹ͋Δ͔ͳ͍ɹ͔ɹ෼͔Βɹͳ͍ ˓B ͋Δ͔ͳ͍ FYJTUPSOPU

提案 5   ࣗಈతʹ֫ಘͨ͠ޠኮ஌ࣝʹجͮ͘ɺ ɹܗଶૉɾ܎Γड͚ղੳͷڞಉϞσϧΛఏҊ͢Δɻ   ޠኮ஌ࣝʹ͸̏ͭͷλΠϓ͕͋Δ ¡  ֨ϑϨʔϜ

関連研究 6   ϔϒϥΠޠͱΞϥϏΞޠͰϥςΟεղੳ๏͕ఏҊ ¡  (PMECFSHBOE5TBSGBSZ ¡  (PMECFSHFUBM

格フレーム 7   ֨ϑϨʔϜΛ࢖༻ͯ͠ɺ1"4ͷଥ౰ੑΛධՁ͢Δ   ֨ϑϨʔϜ͸,BXBIBSBFUBM ͷߏஙํ๏Λద༻

名詞と述語の依存関係の共起確率 8   1"4Ͱଊ͑ΒΕͳ͍܎Γड͚ؔ܎ΛධՁ͢Δ   ܎Γड͚ؔ܎ͷڞى֬཰ͷ౷ܭ೔ຊޠ8FCίʔύε ͷԯจ͔Βऔಘ͢Δ ¡  ໊ࢺ໊ࢺ ÷

単語埋め込み 9   ୯ޠͱ୯ޠྻͷؒͷྨࣅ౓Λܭࢉ͢Δ   XPSEWFD .JLPMPWFUBM ʹΑͬͯɺԯͷ ೔ຊޠͷ8FCจΛ࢖༻ͯ͠܇࿅͢Δ

共同解析モデル 10   $,:ΞϧΰϦζϜΛ࠾༻ ¡  ڞಉղੳϞσϧʹ޿͘࢖༻͞Ε͍ͯΔ   ͜ͷϞσϧͷग़ྗ ¡  ୯ޠɺจઅɺٴͼ܎Γड͚ؔ܎ͷશͯͷ໌֬ͳ݁ՌΛؚΉɺ

共同解析モデルの解析手順 11   ީิ୯ޠͷ$,:ςʔϒϧ΁ͷ౤Ө ¡  ܗଶૉղੳΛ༻͍ͯɺ୯ޠ֨ࢠΛੜ੒͢Δ   ޠ۟ͷੜ੒ ¡

共同解析モデルの解析手順 12   ྡ઀͢ΔαϒπϦʔϖΞͷϚʔδ ¡  ྡ઀͢ΔαϒπϦʔΛϚʔδ͠ɺ ɹ৽͍͠αϒπϦʔΛੜ੒ ¡  ϘτϧΞοϓํࣜͰߦ͏

共同解析モデルの解析手順 13   είΞ͕࠷΋ߴ͍πϦʔΛબ୒ ੜ੒͞Εͨީิ໦ͷதͰείΞ͕࠷΋ߴ͍໦Λग़ྗ

スコア機能とトレーニング 14   είΞػೳ

実験 15   ژ౎େֶςΩετίʔύε /&84 ¡  ,BXBIBSBFUBM

実験 16   ൺֱର৅ ¡  ,/1 ,BXBIBSBBOE,VSPIBTIJ ¡

実験結果 17

実験結果 18

結論 19   ࣗಈ֫ಘͨ͠ޠኮ஌ࣝʹجͮ͘ɺܗଶૉղੳٴͼ܎ Γड͚ղੳͷڞಉϞσϧͷఏҊ   ैདྷͷύΠϓϥΠϯϞσϧʹൺ΂ɺڞಉϞσϧͷ༗ ޮੑΛࣔͨ͠   ܗଶૉղੳͱ܎Γड͚ղੳͷͨΊͷޠኮ஌ࣝΛ