$30 off During Our Annual Pro Sale. View Details »

分類モデルを用いた日本語学習者の格助詞誤り訂正

 分類モデルを用いた日本語学習者の格助詞誤り訂正

言語処理学会第25回年次大会(NLP2019)
テーマセッション: 言語教育と言語処理の接点 での発表スライド
原稿: https://www.anlp.jp/proceedings/annual_meeting/2019/pdf_dir/C4-8.pdf

youichiro

June 22, 2020
Tweet

More Decks by youichiro

Other Decks in Research

Transcript

 1. 0
  ෼ྨϞσϧΛ༻͍ͨ
  ೔ຊޠֶशऀͷ֨ॿࢺޡΓగਖ਼
  খ઒༾Ұ࿕ɼࢁຊ࿨ӳ
  ௕Ԭٕज़Պֶେֶ ࣗવݴޠॲཧݚڀࣨ
  ݴޠॲཧֶձୈճ೥࣍େձ

  View Slide

 2. 1
  ֨ॿࢺޡΓνΣοΧʔΛެ։͍ͯ͠·͢
  IUUQBQQKOMQPSHQDIFDLFS
  ֨ॿࢺʮ͕ɼΛɼʹɼͰʯΛగਖ਼

  View Slide

 3. 2
  എܠ
  గਖ਼Ϟσϧ
  ࣮ݧͱ݁Ռ
  ·ͱΊ
  ෼ྨϞσϧΛ༻͍ͨ೔ຊޠֶशऀͷ֨ॿࢺޡΓగਖ਼

  View Slide

 4. จ๏ޡΓగਖ਼
  จ๏ޡΓగਖ਼ͱ͸ɼจষதͷ͋ΒΏΔจ๏తͳޡΓΛ
  ࣗಈͰగਖ਼͢ΔλεΫͷ͜ͱ
  3
  ं͕ങ͏ ंΛങ͏
  ϚΠΫ಺ଁ ϚΠΫ಺ଂ
  ϝʔϧΛදࣔ͞Ε·͢ ϝʔϧΛදࣔ͠·͢
  डಈଶೳಈଶ

  ಉԻҟٛޠ

  ॿࢺ

  View Slide

 5. ޡΓͷछྨ
  4
  ॿࢺ ׆༻ ઀ଓࢺ ࢦࣔࢺ ٙ໰ࢺ
  ޠॱ ଶ ੍࣌ ಉԻҟٛޠ ྨٛޠ ฼ޠͷ࢖༻
  ΧλΧφޠ ଅԻ௕Ի୙Ի ޡࣈ୤ࣈ ʜ

  View Slide

 6. ޡΓͷछྨ
  5
  ॿࢺ ׆༻ ઀ଓࢺ ࢦࣔࢺ ٙ໰ࢺ
  ޠॱ ଶ ੍࣌ ಉԻҟٛޠ ྨٛޠ ฼ޠͷ࢖༻
  ΧλΧφޠ ଅԻ௕Ի୙Ի ޡࣈ୤ࣈ ʜ
  ޡΓͷछྨ͸ଟذʹ౉Δ

  View Slide

 7. ೔ຊޠֶशऀͷޡΓ܏޲
  6
  4
  1 %
  8 1
  93
  903
  2
  /"*45ޡ༻ίʔύε͔Βͷௐࠪ

  View Slide

 8. ೔ຊޠֶशऀͷޡΓ܏޲
  7
  4
  1 %
  8 1
  93
  903
  2
  /"*45ޡ༻ίʔύε͔Βͷௐࠪ
  ೔ຊޠֶशऀʹͱͬͯ
  ॿࢺͷ࢖͍ํ͕࠷΋೉͍͠

  View Slide

 9. ೔ຊޠߍਖ਼πʔϧͷௐࠪ
  8
  ެ։͞Ε͍ͯΔߍਖ਼πʔϧʹޡΓจΛղੳͤ͞Δ
  ೔ຊޠߍਖ਼αϙʔτ IUUQXXXLJKJDIFDLDPN
  ςΩετॲཧπʔϧ r จষߍਖ਼ IUUQTTP[PVKQXFCBQQUFYUQSPPGSFBEJOH
  ΦϯϥΠϯ೔ຊޠߍਖ਼ิॿπʔϧ IUUQXXXQBQFSHMBTTFTDPNKQMBO
  ϓϨεϦϦʔεߍਖ਼πʔϧ IUUQTXXXWBMVFQSFTTDPNQSPPGSFBEFS
  &OOPIUUQTFOOPKQ
  .JDSPTPGU8PSE
  +VTU3JHIUʢ༗ྉʣIUUQTXXXKVTUTZTUFNTDPNKQQSPEVDUTKVTUSJHIU
  "50,Ϋϥ΢υνΣοΧʔʢ༗ྉʣIUUQTKQSPPGSFBEJOHBUPLDPN
  ௐࠪͨ͠πʔϧ

  View Slide

 10. ೔ຊޠߍਖ਼πʔϧͷௐࠪ
  9
  ॿࢺ ࣭໰ΛରԠ͢Δ
  ׆༻ ϒοΫΛ։͖͍ͯͩ͘͞
  ઀ଓࢺ ମௐ͕ѱ͍͔ͩΒٳΈ·͢
  ࢦࣔࢺ ͦͷҎԼͷαΠζʹઃఆ
  ٙ໰ࢺ ͦͷωοΫϨε͸͍ͭ͘Ͱ͔͢ʁ
  ޠॱ ྑ͍Ͱ͠ΐ͏ɻผʹ͔ͩΒ෰ͳΜͯ
  ଶ ϝοηʔδΛදࣔ͞Ε·͢
  ੍࣌ ࡢ೔͸Ӎ͕߱Δ
  ಉԻҟٛޠ ϝϞϦ಺ଁ
  ྨٛޠ շ଎ʹॲཧ͠·͢
  ฼ޠͷ࢖༻ ษڧ͢ΔͨΊʹϩʔϯΛऔͬͨ
  ΧλΧφޠ ΞΠίϯΛΫϦʔΫ͢Δ
  ଅԻ௕Ի୙Ի ࣭໰͕͋ͨΒ͓ئ͍͠·͢
  ޡࣈ୤ࣈ ࢲཱͪͰ΍Γ·͢
  ݕূͨ͠ޡΓจ

  View Slide

 11. ೔ຊޠߍਖ਼πʔϧͷௐࠪ
  10
  π
  ʔ
  ϧ
  ॿ

  ׆  ٙ


  ޠ
  ॱ ଶ  Ի
  ҟ
  ٛ
  ޠ

  ޠ
  ͷ


  Χ
  λ
  Χ
  φ
  ޠ

  Ի

  Ի

  Ի
  ޡ  º º º º º º º º º º ˚ º ˓
  º º º º º º º º º º ˚ º ˓
  º º º º º º º º º º ˚ º ˓
  º º º º º º º º º º ˚ º ˓
  º º º º º º º º º º º º º
  º ˓ ˚ º º º º º º ˚ º º ˚
  º º º º º ˚ º º º º ˚ º º
  º º º º º º º º º º ˓ º º
  º ݕग़ͳ͠ ˓ ਖ਼͘͠ݕग़ ˚ ݕग़͕ͨ͠ཧ༝͕ҧ͏

  View Slide

 12. π
  ʔ
  ϧ
  ॿ

  ׆  ٙ


  ޠ
  ॱ ଶ  Ի
  ҟ
  ٛ
  ޠ

  ޠ
  ͷ


  Χ
  λ
  Χ
  φ
  ޠ

  Ի

  Ի

  Ի
  ޡ  º º º º º º º º º º ˚ º ˓
  º º º º º º º º º º ˚ º ˓
  º º º º º º º º º º ˚ º ˓
  º º º º º º º º º º ˚ º ˓
  º º º º º º º º º º º º º
  º ˓ ˚ º º º º º º ˚ º º ˚
  º º º º º ˚ º º º º ˚ º º
  º º º º º º º º º º ˓ º º
  ೔ຊޠߍਖ਼πʔϧͷௐࠪ
  11
  º ݕग़ͳ͠ ˓ ਖ਼͘͠ݕग़ ˚ ݕग़͕ͨ͠ཧ༝͕ҧ͏
  શવݕग़ͯ͘͠Εͳ͍ʜ

  View Slide

 13. 12
  എܠ
  గਖ਼Ϟσϧ
  ࣮ݧͱ݁Ռ
  ·ͱΊ
  ෼ྨϞσϧΛ༻͍ͨ೔ຊޠֶशऀͷ֨ॿࢺޡΓగਖ਼

  View Slide

 14. ໰୊ઃఆ
  13
  ໰୊Λ؆୯Խͯ͠औΓ૊Ή
  ֨ॿࢺʮ͕ɼΛɼʹɼͰʯͷޡΓʹݶఆͯ͠గਖ਼
  จதʹ֨ॿࢺޡΓ͕ՕॴͷΈ
  ޡΓՕॴ͸ط஌Ͱ͋Δͱ͢Δ
  ୒ͷ݀ຒΊ໰୊Λղ͘

  View Slide

 15. గਖ਼Ϟσϧ
  14
  <͕ɼΛɼʹɼͰ>
  ͷͲΕ͕౰ͯ͸·Δ͔Λ༧ଌ͢Δ
  ࢲ ͸ ं ʁങͬ ͨ

  View Slide

 16. ઌߦݚڀ
  15
  l೔ຊޠֶशऀͷޡΓ܏޲Λߟྀͨ֨͠ॿࢺగਖ਼z
  ּݪ੣࢘ ౻໺୓໵ খொक Ӭాণ໌ দຊ༟࣏
  ݴޠॲཧֶձୈճ೥࣍େձൃද࿦จू QQr
  Ø छྨͷॿࢺΛର৅ʹగਖ਼
  Ø ݴޠϞσϧख๏ͱ/PJTZ$IBOOFM.PEFMख๏Ͱ࣮ݧ
  ຊݚڀͰ͸
  3//Ϟσϧͱ$//ϞσϧͰ࣮ݧΛߦͳͬͨ

  View Slide

 17. 3//Ϟσϧ
  16
  ... ...
  ...
  ...
  ... ...
  *OQVUXPSET
  BOTXFS
  8PSE
  FNCFEEJOHT
  -45.
  "UUFOUJPO
  .-1 QSFEJDUJPO

  View Slide

 18. $//Ϟσϧ <-FFUBM >
  17
  !"
  !#
  !$
  ʜ
  MBZFST
  LFSOFMTJ[F
  5"3(&5
  .-1
  DPODBU

  View Slide

 19. 18
  എܠ
  గਖ਼Ϟσϧ
  ࣮ݧͱ݁Ռ
  ·ͱΊ
  ෼ྨϞσϧΛ༻͍ͨ೔ຊޠֶशऀͷ֨ॿࢺޡΓగਖ਼

  View Slide

 20. ܇࿅σʔλ
  19
  l #$$8+-BOH గਖ਼จ
  Λ࢖༻ .L.

  l จʹؚ·ΕΔ֨ॿࢺͷ͏ͪҰͭΛϚεΫͯ͠܇࿅
  ࢲ ͸ ं Λ ങͬ ͨ
  ࢲ ͸ ं ."4,ങͬ ͨ

  View Slide

 21. ܇࿅σʔλ
  20
  l #$$8+-BOH గਖ਼จ
  Λ࢖༻ .L.

  l จʹؚ·ΕΔ֨ॿࢺͷ͏ͪҰͭΛϚεΫͯ͠܇࿅
  ࢲ ͸ ं Λ ങͬ ͨ
  ࢲ ͸ ं ."4,ങͬ ͨ
  ΞϊςʔγϣϯίʔύεΛඞཁͱ͠ͳ͍

  View Slide

 22. ςετσʔλ
  21
  l /"*45ޡ༻ίʔύε͔Β֨ॿࢺʮ͕ɼΛɼʹɼͰʯ
  ͷޡ༻λάΛؚΉจΛநग़ จ

  l ͦͷλάҎ֎͸͋Β͔͡Ίగਖ਼͓ͯ͘͠
  ंHPZPDSSbΛ`UZQFbQHBXP`͕HPZPങͬͨ
  ं 5"3(&5ങͬ ͨ BOTXFSΛ

  View Slide

 23. ϕʔεϥΠϯ
  22
  ݴޠϞσϧΛ༻͍ͨగਖ਼ํ๏
  l #$$8+-BOH͔Β୯ޠHSBNݴޠϞσϧΛߏங
  l ʮ͕ɼΛɼʹɼͰʯͷ͏ͪݴޠϞσϧ֬཰͕࠷΋ߴ͘
  ͳΔ΋ͷΛબ୒͢Δ

  View Slide

 24. ࣮ݧઃఆ
  23
  ࣄલֶशࡁΈ୯ޠ෼ࢄදݱΛ࢖༻ FNC

  ‎ /8+$7FDΛXPSEFNCFEEJOHTͷॳظ஋ͱ͢Δ
  ܇࿅ςετσʔλΛશͯฏԾ໊ʹม׵ LBOB

  ‎ ೔ຊޠֶशऀ͸׽ࣈΑΓ΋ฏԾ໊Λଟ༻͢ΔͨΊ

  View Slide

 25. ֨ॿࢺޡΓగਖ਼ͷ࣮ݧ݁Ռ
  24
  Ϟσϧ ਖ਼ղ཰

  ݴޠϞσϧ ϕʔεϥΠϯ

  $//
  $//FNC
  $//FNCLBOB
  -45.
  "UUO-45.
  "UUO-45.FNC
  "UUO-45.FNCLBOB
  +8.41
  +8.59

  View Slide

 26. ग़ྗྫ
  25
  ˓

  Ҋ


  Ͱ
  ޲

  గਖ਼Օॴ͔Β཭Εͨ୯ޠ ػೳޠ
  ΛߟྀͰ͖͍ͯΔ

  View Slide

 27. ग़ྗྫ
  26
  ؒҧ͍͕ͩจ๏తʹ͸ਖ਼͍͠
  º

  Ҋ


  Ͱ
  ΋
  ؒ
  ҧ
  ͍

  View Slide

 28. 27
  ͲΜͳίʔύεΛ܇࿅ͤͨ͞Βྑ͍ͷ͔ʁ!

  View Slide

 29. ܇࿅ίʔύεͷൺֱ
  28
  /"*45ޡ༻ίʔύεɼ-BOHɼ#$$8+ɼ೔ܦ৽ฉίʔύε
  ͷ ׽ࣈͷׂ߹ɼฏۉจ௕Λௐࠪ
  24.7
  29
  35.7
  54
  28.6 30.1
  32.8
  47.7
  0
  10
  20
  30
  40
  50
  NAIST
  Lang-8 BCCWJ
  (%) ()
  ֶशऀίʔύε

  View Slide

 30. ܇࿅ίʔύεͷൺֱ
  29
  #$$8+ɼ೔ܦ৽ฉίʔύεͰαΠζΛສจʹ౷Ұͯ͠
  ϞσϧΛ܇࿅
  ೔ܦ৽ฉ #$$8+
  ݴޠϞσϧ
  $//FNC
  -45.FNC
  #$$8+Ͱ܇࿅ͨ͠ํ͕໌Β͔ʹਫ਼౓͕ߴ͍

  View Slide

 31. ܇࿅ίʔύεͷൺֱ
  30
  #$$8+ɼ೔ܦ৽ฉίʔύεͰαΠζΛສจʹ౷Ұͯ͠
  ϞσϧΛ܇࿅
  ೔ܦ৽ฉ #$$8+
  ݴޠϞσϧ
  $//FNC
  -45.FNC
  #$$8+Ͱ܇࿅ͨ͠ํ͕໌Β͔ʹਫ਼౓͕ߴ͍
  ֶशऀίʔύεʹz͍ۙzίʔύε͕༗ޮͰ͋Δ

  View Slide

 32. 31
  എܠ
  గਖ਼Ϟσϧ
  ࣮ݧͱ݁Ռ
  ·ͱΊ
  ෼ྨϞσϧΛ༻͍ͨ೔ຊޠֶशऀͷ֨ॿࢺޡΓగਖ਼

  View Slide

 33. ·ͱΊ
  32
  l ֨ॿࢺʮ͕ɼΛɼʹɼͰʯͷޡΓʹݶఆͨ͠గਖ਼
  ϞσϧΛߏஙͨ͠
  l ݴޠϞσϧख๏ʹൺ΂ͯɼจશମΛߟྀͨ͠గਖ਼
  Λ͢Δ͜ͱ͕Ͱ͖Δ
  l ΑΓྑ͍గਖ਼ʹ͸ɼֶशऀίʔύε͋Δ͍͸ͦΕ
  ʹl͍ۙzίʔύεͰ܇࿅͢Δ͜ͱ͕༗ޮͰ͋Δ
  ֨ॿࢺޡΓνΣοΧʔΛެ։͍ͯ͠·͢
  IUUQBQQKOMQPSHQDIFDLFS

  View Slide

 34. 33
  ֨ॿࢺޡΓνΣοΧʔΛެ։͍ͯ͠·͢
  IUUQBQQKOMQPSHQDIFDLFS

  View Slide

 35. 34

  View Slide

 36. ෇࿥
  35

  View Slide

 37. 36
  32 6
  17
  17
  17
  17
  %
  17 %
  17
  17 "
  17
  17
  %
  /"*45ޡ༻ίʔύε͔Βௐ΂ͨॿࢺޡΓͷ಺༁

  View Slide

 38. ೔ຊޠֶशऀίʔύε
  37
  n /"*45ޡ༻ίʔύε
  ࡞จର༁%#ʹΞϊςʔγϣϯ
  จষɼछྨͷޡ༻λά
  n -BOH-FBSOFS$PSQPSB
  ݴޠशಘαʔϏε-BOH͔Βऩू
  ೔ຊޠֶशऀ࡞จ จ
  n ࡞จର༁%#
  ࡞จσʔλ݅
  ఴ࡟͞Εͨ࡞จσʔλ݅
  n ࣉଜޡ༻ྫूσʔλϕʔε
  σʔλ૯਺ จ
  ޡ༻λά෇͖จ਺ จ
  n ֶशऀίʔύεʮͳͨͶʯ
  n ΦϯϥΠϯ೔ຊޠޡ༻ࣙయ
  ޡ༻λά෇͖࡞จ݅
  n ೔ຊޠֶशऀ࡞จίʔύε
  ໊෼ͷ࡞จσʔλ

  View Slide