Upgrade to Pro — share decks privately, control downloads, hide ads and more …

用例文を利用したニュース記事からの単文要約の検討

 用例文を利用したニュース記事からの単文要約の検討

牧野 恵, 池田 諭史, 山本 和英. 用例文を利用したニュース記事からの単文要約の検討. 言語処理学会第13回年次大会, pp.692-695 (2007.3)

Transcript

 1. ༻ྫจΛར༻ͨ͠ χϡʔεهࣄ͔Βͷ ୯จཁ໿ͷݕ౼ ௕Ԭٕज़Պֶେֶ ిؾܥ ຀໺ ܙ ஑ా ་࢙

  ࢁຊ ࿨ӳ
 2. ಈػ z طଘͷཁ໿ख๏ ॏཁՕॴΛநग़ ৑௕ͳදݱΛ࡟আ ॏཁ౓͸هࣄʹґଘ ॏཁ౓ͷઃఆ͸೉͍͠ ޠ۟΍จʹରͯ͠ ॏཁ౓

  ॏཁ౓͸ઃఆͤͣɺ ྨࣅ༻ྫΛ࢖ͬͯཁ໿͍ͨ͠ʂ
 3. ༻ྫར༻ܕཁ໿ͷར఺ zͲ͕͜ཁ໿ʹඞཁͳՕॴͳͷ͔ɺ ༻ྫ͕ڭ͑ͯ͘ΕΔ zϧʔϧϕʔεͷཁ໿ͱ͸ҧ͍ɺ ֦ுੑ͕ߴ͍ z౷ܭతͳཁ໿ͱҧ͍ɺ υϝΠϯ͕͚ۙΕ͹ɺ େن໛σʔλ͸͍Βͳ͍

 4. ఏҊख๏ʙશମͷྲྀΕʙ ༻ྫจʹཁ໿ࣄྫ ରԠͨ͠ݪจ͸ ༻͍͍ͯͳ͍

 5. z಺༰͕ྨࣅ͍ͯ͠Δ΋ͷΛબ୒ ڞ௨ͯ͠ग़ݱ͢Δ୯ޠʢཱࣗޠʣ͕ଟ͍ ) ( ) ( ) ( ) ,

  ( 1 1 i Score B T A T weight B A Sim n i i i • • = ∑ = I ) ( ɾ i i T weight ) ( ) ( 1 B T A T i I iจ໨ͷ಺༰ޠू߹ ॏΈ ੵू߹ͷ਺ จͷҐஔʹΑΔείΞ Կจ໨ʹ಺༰ΛΑΓද͢୯ޠؚ͕·Ε͍ͯΔ͔ ) (i Score ༻ྫจA ೖྗهࣄB ྨࣅ༻ྫจͷબ୒ 
 6. ̍ɽ֨৘ใ ֨ॿࢺɺಡ఺͕ಉҰ ̎ɽݻ༗දݱ ݻ༗දݱ͕ಉҰ ̏ɽ֦ுܕฤूڑ཭<ࢁຊΒ> ೔ۜ ˱ ೔ຊۜߦ ֦ுܕฤूڑ཭ ্Ґ̏ҐΛநग़

  ̐ɽ૬ޓ৘ใྔΛ༻͍ͨྨࣅ౓ʦ-JOʧ େձΛ։͘ ˱ ձٞΛ։͘ ྨࣅ౓ ্Ґ̏ҐΛநग़ ରԠจઅީิͷநग़ 
 7. ಓ࿏ެஂຽӦԽҕ/͕ ΋ͷͮ͘Γ࠙ஊձ/͕ খᔹܙࡾट૬/͕ ̎೔ɺ ೋे࢛೔/ɺ ࡢ೥/ͷ ൃ଍͞Ε ࿩͠߹͏ ઃஔͨ͠ ։͍ͨ

  ॳձ߹/Λ ॳձ߹/Λ ଧ্ࣦͪ͛ഊ/Λ ࢲత࠙ஊձ ։͍ͨ ։͍ͨ ઃஔͨ͠ ࿩͠߹͏ ೔ຊͷ੡଄ۀͷ඼࣭؅ཧೳྗͳͲͷ࠶ڧԽࡦΛ࿩͠߹͏΋ͷ ͮ͘Γ࠙ஊձ͕ೋे࢛೔ɺट૬׭ఛͰॳձ߹Λ։͍ͨɻಉ࠙ஊ ձ͸ҵ৓ݝ౦ւଜͷྟքࣄނ΍ࡢ೥ͷ̝̎ϩέοτͷଧ্ͪ ࣦ͛ഊΛ౿·͑ͯখᔹܙࡾट૬͕ઃஔͨ͠ࢲత࠙ஊձɻ ʢҎԼলུʣ ಓ࿏ެஂຽӦԽҕ͕̎೔ɺൃ଍͞Εट૬׭ఛͰॳձ߹Λ ։͍ͨ ྨࣅ༻ྫจͷจઅ ೖྗهࣄ͔ΒಘΒΕͨରԠจઅީิ ೖྗهࣄʢҰ෦ʣ ྨࣅ༻ྫจ 
 8. ઃஔͨ͠ ΋ͷͮ͘Γ࠙ஊձ͕ <s> ~ຽӦԽҕ͕ ̎೔ɺ ൃ଍͞Ε ॳձ߹Λ </s> ྨࣅ༻ྫจ ೋे࢛೔ɺ

  ։͍ͨ ॳձ߹Λ ։͍ͨ ϊʔυɿରԠจઅީิ ީิͷ૊߹ͤ ࠷దܦ࿏໰୊ ରԠจઅީิͷ૊߹ͤ 
 9. zϊʔυείΞ ྨࣅ༻ྫจʹࣅ͍ͯΔ͔ zΤοδείΞ ࿈઀͸Α͍͔ ɾ ྨࣅ༻ྫจʹࣅͨจઅ ɾ ΑΓ࿈઀ͷΑ͍ཁ໿จ ಈతܭը๏Ͱ ྨࣅ༻ྫจͷจઅ

  ೖྗจ͔ΒಘͨରԠจઅީิ ൺֱ ˱ ˓ จ໨ ˠ จ໨ ˠ จ໨ ˠ จ໨ ʷ จ໨ ˠ จ໨ ˠ จ໨ ˠ จ໨ 
 10. zϊʔυείΞ zΤοδείΞ 1 ) ( ) ( 1 ) ,

  ( 1 1 + − = − − i i i i w loc w loc w w E ⎩ ⎨ ⎧ = rank w N i / 1 5 . 0 max ) ( ֨৘ใ͔ݻ༗දݱλά͕Ұக ͦΕҎ֎ ) , ( ) 1 ( ) ( ) ( 1 1 0 i m i i m i i p p w w E w N W Score ∑ ∑ = − = − + = α α Λ࠷େʹ͢ΔΑ͏ͳܦ࿏ ΛٻΊΔ ) ( p p W Score p W ˆ 
 11. ධՁ࣮ݧ z࣮ݧσʔλ z༻ྫจɿ ਓखͰ࡞੒͞Εͨཁ໿จ ৽װઢཁ໿จ จʢʙ೥ʣ z܇࿅σʔλ ೥೔ܦ৽ฉ݅ zςετσʔλ ೥೔ܦ৽ฉ݅

  ຊख๏Ͱબ୒͠ɺ૊߹ͤΛߦͬͨ จઅ͸ਖ਼͔ͬͨ͠ͷ͔ʁ ˠ ධՁ 
 12. zൺֱର৅ ೖྗهࣄͷจ໨ z٬؍ධՁʢจઅൺֱʹΑΔධՁʣ ظ଴͍ͯͨ݁͠Ռ͸ಘΒΕͳ͔ͬͨɻ Կ͕ݪҼͳͷ͔ʁ γεςϜ֤෦ͷओ؍ධՁ΁ ϕʔεϥΠϯͱͷൺֱ ൺֱର৅ ຊख๏ ࠶ݱ཰

   ద߹཰  ̛஋  
 13. ओ؍ධՁͷ݁Ռ ̍ʣྨࣅ༻ྫจ͸ਖ਼͘͠બ୒Ͱ͖͍ͯΔ͔ʁ ̎ʣ୯จཁ໿͸ೖྗهࣄʹରͯ͠ద੾ʁ ̎ʣ୯จཁ໿ ʲ#FTUʳ  ʲ̬̾́͂̓ʳ ૯ܭ

  ʲ#FTUʳ         ʲ̬̾́͂̓ʳ   ૯ܭ   ྨ ࣅ ༻ ྫ จ ̍ʣ
 14. ʢ༻ʣલ೥ಉ݄ൺ ʢೖʣલ೥ಉ݄ʹ/ൺ΂ ʢ༻ʣ݄̑ϝυʹ ʢೖʣ݄̑Λ/ϝυʹ ൺֱ ݱࡏͷγεςϜͰ͸… ྨࣅ༻ྫจจઅ ೖྗهࣄจઅ ˓ྨࣅ༻ྫจ ˓PS˚୯จཁ໿

  ʷྨࣅ༻ྫจ ʷ୯จཁ໿ z ྨࣅ༻ྫจͷબ୒෦෼ Ͳͷ୯ޠʹ஫໨ͯ͠༻ྫΛબͿ΂͖͔࠶ݕ౼ z ୯จཁ໿෦෼ ˠܗଶૉ΍ෳ਺ͷจઅ΁มߋ͢΂͖ ओ؍ධՁ݁ՌΑΓ 
 15. ·ͱΊ z༻ྫར༻ܕͷཁ໿ख๏ΛఏҊ zॏཁ౓͸ઃఆͤͣʹɺ ཁ໿ࣄྫʮ༻ྫจʯʹैͬͨཁ໿ख๏ ྨࣅ༻ྫจɿ େࡕ஍ࡋͰ೔ɺ࿦ࠂٻܐެ൑͕։͔Εɺݕ࡯ଆ͸୐ؒඃࠂʹࢮܐΛ ٻܐͨ͠ ୯จཁ໿ɿ ԣ඿஍ࡋͰೋेҰ೔ɺ࿦ࠂٻܐެ൑͕։͔Εɺݕ࡯

  ଆ͸઒໺ඃࠂʹ௄໾Ұ೥࿡݄Λٻܐͨ͠ ग़ྗྫɿ̎จˠ̍จʹཁ໿
 16. ิ଍ ༻ྫར༻ܕͷཁ໿ z༻ྫจʹ͍ͭͯ zਓखͰ࡞੒͞Εͨཁ໿จ z೔ܦHPP͔Βϝʔϧ഑৴͞Ε͍ͯΔ χϡʔε ̍จ໨ ʮ৽װઢཁ໿จʯ ʢ৽װઢं಺ͰྲྀΕ͍ͯΔχϡʔεͱಉ͡ʣ ཁ໿จʹରԠͨ͠ݪจ͸༻͍͍ͯͳ͍

  ༰қʹऩूՄೳ
 17. ิ଍ ʙྨࣅ༻ྫจͷબ୒ʙ ) (i Score Կจ໨ʹ಺༰ΛΑΓද͢୯ޠ͕ ؚ·Ε͍ͯΔͷ͔ʁ ৽ฉهࣄ λΠτϧ ৽ฉهࣄຊจ

  ൺֱ
 18. ิ଍ ૬ޓ৘ใྔΛ༻͍ͨྨࣅ౓