Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Leveraging Crowdsourcing for Paraphrase Recognition

kakubari
November 28, 2017

Leveraging Crowdsourcing for Paraphrase Recognition

長岡技術科学大学
自然言語処理研究室
角張竜晴

kakubari

November 28, 2017
Tweet

More Decks by kakubari

Other Decks in Technology

Transcript

  1.          

     ௕ Ԭ ٕ ज़ Պ ֶ େ ֶ  ࣗ વ ݴ ޠ ॲ ཧ ݚ ڀ ࣨ  ֶ ෦ ̐ ೥  ֯ ு ཽ ੖  Leveraging Crowdsourcing for Parapharase Recognition Martin Tschirsich, Gerold Hintz Proceedings of the 7th Linguistic Annotation Workshop & Interoperability with Discourse, pages 205–213, Sofia, Bulgaria, August 8-9, 2013. ਤ΍ද͸࿦จΑΓҾ༻ 1
  2. パラフレーズの定義 5 ʲύϥϑϨʔζͷ֓೦ʳ %PMBOBOE#SPDLFUU   —  ҙຯత࿦ྨࣅੑͱ୯ޠΦϯτϩδʔͷ֓೦ʹີ઀ʹ ؔ࿈͍ͯ͠Δɻ — 

    ਖ਼֬ͳఆٛ͸ͳ͘ɺෳࡶͳΨΠυϥΠϯͰܾఆɻ  Ϋϥ΢υιʔγϯάΛߦ͏ࡍʹ͸ɾɾɾ ࡞ۀऀͷ௚ײʹཔ͍ͬͯΔ͜ͱʹ஫ҙ͢Δඞཁ͕͋Δɻ ὎ྫจ͕ॏཁͰ͋Δ
  3. パラフレーズの認識 6 ʲύϥϑϨʔζͷೝࣝʳ 4PDIFSFUBM   —  ʮ೚ҙͷ௕͞ͱܗͰ͋ΔͭͷϑϨʔζ͕ಉ͡ҙຯͰ͋ Δ͔Ͳ͏͔ʯΛܾఆ͢Δ ʲઌߦݚڀʳ

    —  /άϥϜͷॏͳΓ —  ґଘؔ܎πϦʔͷॏͳΓ΍ฤूڑ཭ Ͱܾఆ͍ͯ͠Δɻ  ὎ಉٛޠ΍ҙຯʹ౳͍͔͠ΛࣝผͰ͖ͳ͍ɻ  ὎ݴ͍׵͑ΒΕͨจষΛֶशͯࣗ͠ಈࣝผ͢Δඞཁ͕͋Δɻ
  4. 先行研究 7 ;IPVFUBM   ὎ύϥϨϧίʔύεΛ༻͍ͨ຋༁ϕʔεͷख๏  .BEOBOJFUBM  

    ὎ҙຯྨࣅੑͷධՁ —  ୯७ͳ̎஋Ͱ͸ͳ͘ɺ࿈ଓతͳ஋ͰϖΞͷྨࣅͯ͠ ͍Δఔ౓Λࣔ͢ɻ —  ςΩετͷྨࣅੑ͸ɺଟ਺ͷΫϥ΢υϫʔΧʔͷ൑ அΛฏۉԽ͢Δɻ
  5. クラウドソーシング 8 ʲ$SPXE'MPXFSʳ —  Ϋϥ΢υιʔγϯάΛߦ͏8FCαʔϏε —  ࡞ۀऀͷλεΫ਺΍ډॅ஍Λ੍ݶͰ͖Δ —  ऩू͞Εͨσʔλͷਖ਼౰ੑΛݕূ͢ΔγεςϜ ¡ 

    ࣮ࡍͷσʔλΛॲཧ͢Δલʹɺ࡞ۀऀ͕ਖ਼͘͠ճ౴͢ΔΑ͏ ʹνΣοΫΛ͢Δɻ ¡  ࡞ۀதʹ΋ɺਖ਼͘͠ճ౴͍ͯ͠Δ͔νΣοΫ͢Δɻ ὎ਖ਼ղσʔλͱ࡞ۀ݁ՌΛൺֱ͠ɺ৴པੑΛ୲อ͢Δɻ 
  6. 多段階の言い換えの生成 12   ࡞ۀऀʹϑϨʔζQ  Λఏࣔ͠ɺݴ͍׵͑Q  ΛಘΔɻ   ଞͷ࡞ۀऀʹϑϨʔζQ

     Λఏࣔ͠ɺQ  Λݕূ͠ɺ ݴ͍׵͑Q  ΛಘΔɻ ὎ޡͬͨݴ͍׵͑ΛݮΒ͠ɺ ɹΑΓଟ͘ͷݴ͍׵͕͑ಘΒΕΔɻ