Pro Yearly is on sale from $80 to $50! »

Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis

0027afdecf3ac9d5a586f60abcec41d8?s=47 kakubari
October 23, 2017

Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis

長岡技術科学大学
自然言語処理研究室
学部4年 角張竜晴

0027afdecf3ac9d5a586f60abcec41d8?s=128

kakubari

October 23, 2017
Tweet

Transcript

  1.          

     ௕ Ԭ ٕ ज़ Պ ֶ େ ֶ  ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ  ֶ ෦ ̐ ೥  ֯ ு ཽ ੖  Automatically Acquired Lexical Knowledge Improves Japanese Joint Morphological and Dependency Analysis Daisuke Kawahara and Yuta Hayashibe and Hajime Morita and Sadao Kurohashi Proceedings of the 15th International Conference on Parsing Technologies, pages 1–10, Pisa, Italy; September 20–22, 2017. ਤ΍ද͸࿦จΑΓҾ༻ 1
  2. 概要 2 ˗ఏҊ —  ࣗಈతʹ֫ಘ͞Εͨޠኮ஌ࣝʹجͮ͘ܗଶૉղੳٴ ͼ܎Γड͚ղੳͷڞಉϞσϧͷఏҊ  ˗݁Ռ —  ैདྷͷύΠϓϥΠϯϞσϧΑΓ΋ڞಉϞσϧͷ༗ޮ

    ੑΛূ໌
  3. はじめに 3 —  ηάϝϯτԽ͞Ε͍ͯͳ͍ݴޠͷղੳ ܗଶૉղੳ ୯ޠ෼ׂɺ104෇͚ɺݟग़͠ޠղੳ    

     Ὃ ܎Γड͚ղੳ΍ड़ޠ—Ҿ਺ߏ଄ 1"4 ղੳͳͲ  —  ύΠϓϥΠϯॲཧͷ໰୊ ¡  ܗଶૉղੳͷΤϥʔ͕ޙଓͷղੳʹ఻ൖ͢Δ  ὎ܗଶૉղੳͰ୯ޠ෼ׂΛ͢Δࡍʹɺߏจతٴͼߏ଄తͳ஌ࣝ ͕ඞཁͳ৔߹͕͋Δɻ
  4. はじめに 4  Մೳੑɹ͕ɹ͋Δ͔ͳ͍ɹ͔ɹ෼͔Βɹͳ͍   ˓B ͋Δ͔ͳ͍  FYJTUPSOPU

       ὎Մೳੑ͕͋Δ͔Ͳ͏͔  ɹ C ͋Δ͔ͳ͍  XBMLOPU    ὎Մೳੑ͕า͔ͳ͍   
  5. 提案 5 —  ࣗಈతʹ֫ಘͨ͠ޠኮ஌ࣝʹجͮ͘ɺ ɹܗଶૉɾ܎Γड͚ղੳͷڞಉϞσϧΛఏҊ͢Δɻ  —  ޠኮ஌ࣝʹ͸̏ͭͷλΠϓ͕͋Δ ¡  ֨ϑϨʔϜ

    ¡  ໊ࢺͱड़ޠͷ܎Γड͚ؔ܎ͷڞى֬཰ ¡  ୯ޠຒΊࠐΈ ಛʹɺ֨ϑϨʔϜ͸ɺܗଶతɾߏจతͳᐆດੑΛղফ ͢Δͷʹ༗ޮͳख͕͔Γɻ
  6. 関連研究 6 —  ϔϒϥΠޠͱΞϥϏΞޠͰϥςΟεղੳ๏͕ఏҊ ¡  (PMECFSHBOE5TBSGBSZ  ¡  (PMECFSHFUBM 

    ¡  (SFFOBOE.BOOJOH  ¡  (PMECFSHBOE&MIBEBE  —  ޠኮ஌ࣝͳ͠ͷڞಉղੳϞσϧΛఏҊ ¡  5BXBSBFUBM 
  7. 格フレーム 7 —  ֨ϑϨʔϜΛ࢖༻ͯ͠ɺ1"4ͷଥ౰ੑΛධՁ͢Δ  —  ֨ϑϨʔϜ͸,BXBIBSBFUBM  ͷߏஙํ๏Λద༻  

    ܗଶૉղੳͱ܎Γड͚ղੳ +6." ͱ,/1 Λੜίʔύεʹద༻ ͢Δɻ ὎ΤϥʔͷӨڹ؇࿨ͷͨΊɺᐆດੑͷͳ͍৴པੑͷߴ͍1"4ͷΈΛந ग़    ಉ͡ҙຯΛ࣋ͭ1"4Λड़ޠͱ࠷΋͍ۙҾ਺Λ݁߹ࣝ͠ผ͢Δɻ ὎ྫ͑͹ɺʮಓΛา͘ʯͱʮொΛา͘ʯͳͲͷड़ޠ—Ҿ਺ͷ૊Ͱ۠ผ͢ Δɻ  ԯͷ೔ຊޠจ὎ड़ޠ ໿  ͷ֨ϑϨʔϜΛऔಘ
  8. 名詞と述語の依存関係の共起確率 8 —  1"4Ͱଊ͑ΒΕͳ͍܎Γड͚ؔ܎ΛධՁ͢Δ —  ܎Γड͚ؔ܎ͷڞى֬཰ͷ౷ܭ೔ຊޠ8FCίʔύε ͷԯจ͔Βऔಘ͢Δ ¡  ໊ࢺ—໊ࢺ ÷ 

    ෳ߹໊ࢺΛؚΉ໊ࢺؒͷґଘؔ܎ΛΧόʔ ¡  ड़ޠ—ड़ޠ ÷  ड़ޠؒͷґଘؔ܎ΛΧόʔ
  9. 単語埋め込み 9 —  ୯ޠͱ୯ޠྻͷؒͷྨࣅ౓Λܭࢉ͢Δ —  XPSEWFD .JLPMPWFUBM  ʹΑͬͯɺԯͷ ೔ຊޠͷ8FCจΛ࢖༻ͯ͠܇࿅͢Δ

    ¡  ࣍ݩ਺ͰDPTྨࣅ౓Λܭࢉ͢Δ
  10. 共同解析モデル 10 —  $,:ΞϧΰϦζϜΛ࠾༻ ¡  ڞಉղੳϞσϧʹ޿͘࢖༻͞Ε͍ͯΔ —  ͜ͷϞσϧͷग़ྗ ¡  ୯ޠɺจઅɺٴͼ܎Γड͚ؔ܎ͷશͯͷ໌֬ͳ݁ՌΛؚΉɺ

    ɹ࠷దͳղੳπϦʔΛग़ྗ
  11. 共同解析モデルの解析手順 11   ީิ୯ޠͷ$,:ςʔϒϧ΁ͷ౤Ө ¡  ܗଶૉղੳΛ༻͍ͯɺ୯ޠ֨ࢠΛੜ੒͢Δ    ޠ۟ͷੜ੒ ¡ 

    104ϕʔεͷޠ۟ͷմͷنଇΛ ɹ࢖༻͠$,:ςʔϒϧͰੜ੒͞ΕΔ ὎ϧʔϧ͸,/1͔Βநग़͞ΕΔ  ¡  ࠷খͷαϒπϦʔͱͯ͠Έͳ͢ 
  12. 共同解析モデルの解析手順 12   ྡ઀͢ΔαϒπϦʔϖΞͷϚʔδ ¡  ྡ઀͢ΔαϒπϦʔΛϚʔδ͠ɺ ɹ৽͍͠αϒπϦʔΛੜ੒  ¡  ϘτϧΞοϓํࣜͰߦ͏

     ὎ೖྗจશମʹର͢Δީิ໦
  13. 共同解析モデルの解析手順 13   είΞ͕࠷΋ߴ͍πϦʔΛબ୒ ੜ੒͞Εͨީิ໦ͷதͰείΞ͕࠷΋ߴ͍໦Λग़ྗ    

  14. スコア機能とトレーニング 14 —  είΞػೳ      

      XJ ɿಛ௃ͷॏΈ        ЇJ ɿಛ௃Jͷಛ௃ؔ਺  —  ֶशखॱ   ಛ௃ྔΛॳظԽ͠ɺ܇࿅ίʔύε಺ͷ֤จͷ୯ޠ֨ࢠ Λೖྗ   ೖྗจʹର͢Δީิ໦ΛಘΔ   ΰʔϧυπϦʔʹର͢Δ܎Γड͚είΞ͕࠷΋ߴ͍π ϦʔΛਖ਼ͷΠϯελϯεͱ͢Δ  ಛ௃ͷॏΈ͸܇࿅ίʔύε಺ͷશͯͷจ͔Β࠷దԽ͞ΕΔɻ
  15. 実験 15 —  ژ౎େֶςΩετίʔύε /&84  ¡  ,BXBIBSBFUBM  — 

    ژ౎େֶ΢ΣϒจॻϦʔυίʔύε 8&#  ¡  )BOHZPFUBM  
  16. 実験 16 —  ൺֱର৅ ¡  ,/1 ,BXBIBSBBOE,VSPIBTIJ   ¡ 

    $BCP$IB 4BTTBOP   —  ධՁ߲໨ ¡  4FHɿ୯ޠ෼ׂ ¡  104ɿ4FH 104 ¡  "MMɿ4FH 104 ͖Ίࡉ͔͍104 جຊܗ ¡  Q4FRɿจઅ۠੾Γ ¡  6"4-"4ɿϥϕϧͳ͠ϥϕϧ͋Γͷ܎Γड͚ղੳ
  17. 実験結果 17

  18. 実験結果 18

  19. 結論 19 —  ࣗಈ֫ಘͨ͠ޠኮ஌ࣝʹجͮ͘ɺܗଶૉղੳٴͼ܎ Γड͚ղੳͷڞಉϞσϧͷఏҊ —  ैདྷͷύΠϓϥΠϯϞσϧʹൺ΂ɺڞಉϞσϧͷ༗ ޮੑΛࣔͨ͠ —  ܗଶૉղੳͱ܎Γड͚ղੳͷͨΊͷޠኮ஌ࣝΛ

    χϡʔϥϧωοτϫʔΫϕʔεϞσϧʹ૊ΈࠐΉ͜ ͱʹࢼΈΔ