Save 37% off PRO during our Black Friday Sale! »

言語処理学会2020

41bf71296a6d916e7b08dd46e07f9266?s=47 Shogo Ujiie
March 04, 2021
23

 言語処理学会2020

41bf71296a6d916e7b08dd46e07f9266?s=128

Shogo Ujiie

March 04, 2021
Tweet

Transcript

 1. 4*(/"-$"5$)&3 ҩֶ࿦จΛର৅ͱͨ͠ ҩༀ඼༗֐ࣄ৅ࣗಈ൑ఆγεςϜͷߏங ࢯՈᠳޗɼԬकஉɼౡ୩ߒ࢘ɼҏࡕߤɼ༗ຊѯɼ ໼ాॡଠ࿠ɼएٶᠳࢠɼߥ຀ӳ࣏ ಸྑઌ୺Պֶٕज़େֶӃେֶ גࣜձࣾ෋࢜θϩοΫε 2020/3/13 1 ݴޠॲཧֶձୈճ೥࣍େձ

  /-1 &
 2. ݚڀ֓ཁʢʣ ҩֶ࿦จΛର৅ʹҩༀ඼ͷ౤༩ʹΑΓੜ͡Δ ޷·͘͠ͳ͍ࣄ৅ʢ༗֐ࣄ৅ɼ"%&ʣΛ؂ࢹ 2020/3/13 2 ̍࣍εΫϦʔχϯά "%&ͷ༗ແɾॏಞ౓Λ෇༩ ̎࣍εΫϦʔχϯά ઐ໳ՈʹΑΔ࠷ऴ൑அ …

  … ADEなし ADEあり 報告不要 要報告
 3. • "%&൑ఆʢ̍࣍εΫϦʔχϯάʣΛࣗಈԽ • "%&൑ఆͷࠜڌͱͳΔจΛநग़ ݚڀ֓ཁʢʣ 2020/3/13 3 ̶̖̙̖̼̔̌ʹ૿ྔ΋ޮՌෆे෼ͷͨΊɺ ̖̙̖Λ̶̼̐̌ʹݮྔ͠ɺʜ 医薬品

  医薬品 医薬品 ҩༀ඼Λݮྔ ͨ͠ͷ͸ޮՌ ෆे෼ͷͨΊ ϓϨΨόϦϯΛ௥Ճ͠઴૿͢Δͱ௧Έ͸ܰݮ ͕ͨ͠ɺ෭࡞༻͕ग़ݱ͠ݮྔΛ༨ّͳ͘͞Εͨɻ ҩༀ඼Λݮྔ ͨ͠ͷ͸ ෭࡞༻͕ग़ݱ ͨͨ͠Ί ADEあり ADEなし
 4. 2020/3/13 4 提案システム SIGNAL CATCHER "%&൑ఆͷࠜڌจ ॏಞදݱ ʢࢮ๢ɼೖӃͳͲʣ ΛؚΉจ ঱ঢ়ʢҰൠ໊ʣ

  ҩༀ඼ʢҰൠ໊ʣ
 5. എܠɾ໨త • എܠ • ҩֶ࿦จΛର৅ͱͨ͠ҩༀ඼ʹΑΔ"%&؂ࢹ • "%&ͷ൑ఆʢ̍࣍εΫϦʔχϯάʣʹ͸ ๲େͳίετʢे਺෼̍࿦จɼ೥ؒ਺ઍຊʣ • ໨త

  • ҩֶ࿦จʹ͓͍ͯ"%&ͷݕग़ʹΑΔ ̍࣍εΫϦʔχϯάͷࣗಈԽ • "%&ݕग़ͷࠜڌͱͳΔจͷநग़ʹΑΔ ̎࣍εΫϦʔχϯάͷޮ཰Խ 2020/3/13 5
 6. ؔ࿈ݚڀ • ҩֶ࿦จ͔Βͷ"%&நग़ʹؔ͢Δݚڀ • ҩༀ඼ͱ঱ঢ়ͷؔ܎ΛΞϊςʔγϣϯ <(VSVMJOHBQQB > • จߏ଄Λ༻͍ͯ"%&ͱҩༀ඼ͷؔ܎Λநग़ </FHJ

  > • ೔ຊޠʹ͓͚Δ"%&நग़ • ༀྺ৘ใ͔Β"%&Λநग़ <ࡾӜ > • ిࢠΧϧς͔Β"%&ؔ܎Λநग़ <6TVJ > 2020/3/13 6
 7. ࣮ݧࡐྉ 1%'ܗࣜͷҩֶ࿦จใΛ࢖༻ • 0$3ͰςΩετʹม׵ • ۟఺ɼશ֯ϐϦΦυͰจʹ෼ׂ • શ֯ه߸Λ࡟আ • 0$3ʹΑΔޡม׵Λ໨ࢹͰ֬ೝ

  จҙ͕ͱΕͳ͍΋ͷΛϑΟϧλϦϯά ʜ/JWPMVNBC౤༩̍̐೔ޙʹݺٵۤͷͨΊ౰Ӄ΁ٹٸൖૹɻͦͷ ޙٸ଎ʹݺٵෆશ͕ਐߦ͠ɺ౤༩̐̎೔ޙʹࢮ๢ͱͳͬͨɻʜ 2020/3/13 7 ྫ
 8. Ξϊςʔγϣϯʢจ୯Ґʣ "%&ͷ༗ແɿ5SVF 5 'BMTF ' Λϥϕϧ෇͚ .59෭࡞༻Ͱܧଓࠔ೉ͱͳΓηϧτϦζϚϓϖΰϧʹมߋɻ ̭೔͔Βӈ؟௧͕ग़ݱ͠ɺಉ࣌ʹ໨͕΅΍͚ΔΑ͏ʹͳͬͨ ̑̕ࡀ࣌ΑΓ̧̖ʹର̢̩̭ͯ͠಺෰ɻ

  ̭̎̌̍೥݄̏ʹݺٵࠔ೉͕͋Γड਍ɻ 2020/3/13 8 5ɿ"%&͋Γ 'ɿແؔ܎จ 5ɿෳ਺จʹ౉Δ"%&͋Γ
 9. Ξϊςʔγϣϯʢจॻ୯Ґʣ "%&ͷจͷ༗ແɿ5SVF 5 ͷจΛจҎ্ؚΉ ࿦จʹ"%&͋ΓΛϥϕϧ෇͚ "%&͋Γ࿦จ͸จॻจॻத 2020/3/13 9 දɿ"%&͋Γ࿦จͱͳ͠࿦จͷฏۉ෼਺ͱฏۉจࣈ਺

 10. ఏҊγεςϜʛ֓ཁ ҩༀ඼ͷ"%&ΛؚΉจॻ෼ྨͱࠜڌͱͳΔ จ෼ྨ 2020/3/13 10 ҩྍදݱ நग़ɾਖ਼نԽ ࠜڌจநग़ ͋Γ ͳ͠

  "%&࿦จ ൑ఆ
 11. ҩྍදݱநग़ɾਖ਼نԽ • ݻ༗දݱநग़ث.FE&9+<>Λ༻͍ͯ ප໊ɾҩༀ඼໊Λநग़ • ප໊ɾҩༀ඼໊ࣙॻͰਖ਼نԽ • ສපࣙॻ<>ɼඦༀࣙॻ <>Λ࢖༻ •

  ྨࣅ౓͕࠷΋ߴ͍୯ޠͰਖ਼نԽ ؔઅϦ΢ϚνؔઅϦ΢Ϛν ʹରͯ͠.59ϝττϨΩαʔτ ̔ᶴʗ೔Λ౤༩தͰ͋ͬͨɻ 11 ҩྍදݱ நग़ɾਖ਼نԽ ࠜڌจநग़ ͋Γ ͳ͠ "%&࿦จ ൑ఆ [1] Eiji Aramaki, Ken Yano, and Shoko Wakamiya. MedEx/J: A one-scan simple and fast NLP tool for japanese clinical texts. MEDINFO, 2018. [2] Kaoru Ito, Hiroyuki Nagai, Taro Okahisa, Shoko Wakamiya, Tomohide Iwao, and Eiji Aramaki. J- MeDic: A Japanese Disease Name Dictionary based on real clinical usage. LREC , 2018. [3] http://mednlp.jp のリソースを参照のこと
 12. "%&࿦จ൑ఆ • ࿦จ୯ҐͰ"%&͕ݴٴ͞Ε͍ͯΔ͔෼ྨ • -PHJTUJD3FHSFTTJPO • ಛ௃ྔ • #BHPG8PSET #P8

  ʢ࣍ݩʣ • .FEJDBM&YQSFTTJPO .& • ප໊ɾҩༀ඼໊ʢ࣍ݩʣ • ප໊ɾҩༀ඼໊ͷඪ४໊ʢ࣍ݩʣ • ප໊ɾҩༀ඼໊ͷग़ݱස౓ͷ૯࿨ʢ̎࣍ݩʣ 2020/3/13 12 ҩྍදݱ நग़ɾਖ਼نԽ ࠜڌจநग़ ͋Γ ͳ͠ "%&࿦จ ൑ఆ
 13. ࠜڌจநग़ • "%&͋Γͱ൑ఆ͞Εͨ࿦จʹ͍ͭͯࠜڌจΛநग़ • -PHJTUJD3FHSFTTJPO • ಛ௃ྔ • #BHPG8PSET #P8

  ʢ࣍ݩʣ • .FEJDBM&YQSFTTJPO .& ʢ࣍ݩʣ • $POUFYUલޙͷจͷ #P8 .& ʢ࣍ݩʣ 2020/3/13 13 ࠜڌจநग़ ͋Γ ͳ͠ "%&࿦จ ൑ఆ ҩྍදݱ நग़ɾਖ਼نԽ
 14. ࣮ݧ • લॲཧ • จΛ.F$BCʢ*1"ࣙॻʣʹΑΓܗଶૉʹ෼ׂ • ̍౓͔͠ग़ݱ͠ͳ͍୯ޠ͸࡟আ • ධՁ •

  ̑෼ׂަࠩݕఆʹͯ'஋͕࠷େͷςετηοτʹରͯ͠ 1SFDJTJPO3FDBMMۂઢΛඳը • ࠜڌจநग़ϞσϧͰ͸ɼจॻ୯ҐͰ̑෼ׂަࠩݕఆ Λߦ͍ɼ"%&͋Γ࿦จͷΈͰֶश 2020/3/13 14
 15. ݁Ռ "%&࿦จ൑ఆɿ'஋ ࠜڌจநग़ʹ͓͚Δ 1SFDJTJPO3FDBMMۂઢ "%&࿦จ൑ఆʹ͓͚Δ 1SFDJTJPO3FDBMMۂઢ 2020/3/13 Recall Precision Precision

  Recall 15 1.0 0.8 0.6 0.4 0.2 0 0.2 0.4 1.0 0.6 0.8 0 1.0 0.8 0.6 0.4 0.2 0 0.2 0.4 1.0 0.6 0.8 0 BoW + ME BoW BoW + ME BoW BoW + ME + context ࠜڌจநग़ɿ'஋
 16. ޡΓ෼ੳʢʣ 'BMTF/FHBUJWFʢจจʣ • ࠜڌจ͕ෳ਺จʹ·͕ͨΔ৔߹ • "%&ͷݴٴ͕ᇥۂతͳ৔߹ 2020/3/13 ̑̕ࡀ࣌ΑΓ̧̖ʹର̢̩̭ͯ͠಺෰ɻ ̭̎̌̍೥݄̏ʹݺٵࠔ೉͕͋Γड਍ɻ 16

  ͦͷ࣌఺Ͱ̡̠ʵ̒͸̏̌̌ͱਖ਼ৗ஋Ͱ͋ͬͨɽ ̎̌̍̓೥݄̎ʹ̡̠—͕̒̍̌̒̍ͱɼ̢̩̭։࢝ ޙॳΊͯߴ஋Λఄͨ͠ɽ
 17. ޡΓ෼ੳʢʣ 'BMTF1PTJUJWFʢจจʣ • Ұൠతͳҩֶ஌͕ࣝड़΂ΒΕ͍ͯΔ৔߹ • "%&΁ͷॲஔ͕ड़΂ΒΕ͍ͯΔ৔߹ 2020/3/13 εςΟʔϰϯεɾδϣϯιϯ঱ީ܈͸ɼൃ೤ͱ؟ɼޱ৶ɼ֎ӄ෦ͳͲ ͷൽෘ೪ບҠߦ෦ʹ͓͚Δॏ౓ͷ೪ບ਄ɼߚൗͱදൽͷյࢮੑই֐ʹ جͮ͘ਫ؞ɾͼΒΜΛಛ௃ͱ͢Δɻ

  ଟ͘͸ҩༀ඼͕ݪҼͰൃ঱͢Δ࠷ॏ঱ܕༀ਄ͷҰͭͱߟ͑ΒΕΔ͕ɼ Ұ෦͸΢Πϧε΍ϚΠίϓϥζϚͳͲͷײછʹ൐ͬͯൃ঱͢Δɻ 17 ΞΩγνχϒ։࢝Ҏ߱ɺ֎Պॲஔͷطԟ͸ͳ͍͕ɺσϊεϚϒ։࢝ޙ ͔݄̒Ͱӈ্લࣃ෦ʹഉ೵Λ൐͏ࠎ࿐ग़͕͋Γɺ͞Βʹࠨ্લࣃ෦ͱ ࠨԼӓࣃ෦ʹࠎ࿐ग़ΛೝΊɺ0/+ 4UBHF ͷ਍அͱͳͬͨɻ σϊεϚϒΛٳༀ͠ɺอଘྍ๏Λߦ͏΋ෆมͰ͋ͬͨɻ
 18. ߟ࡯ • σʔλͷෆۉߧ • ࠜڌจʢ5ʣ͕จɼແؔ܎จʢ'ʣ͕จ • গ਺ͷΫϥεʢ5ʣͷ෼ྨਫ਼౓͕ѱԽ • ࠜڌจͷσʔλྔͷෆ଍ʹΑΔաֶश 2020/3/13

  18 ֶशσʔλྔ ' 2000 4000 6000 8000 10000 12000 1.0 0.8 0.6 0.4 Training score Validation score
 19. ·ͱΊɾࠓޙͷ༧ఆ • ·ͱΊ • ҩༀ඼ʹΑΔ༗֐ࣄ৅؂ࢹʹ͓͚Δ ̍࣍εΫϦʔχϯάΛࣗಈԽ͢ΔγεςϜΛߏங • ̍࣍εΫϦʔχϯάͷࠜڌจΛநग़ • ࠓޙͷ༧ఆ

  • λεΫͷಛ௃΍ಛ௃ྔͷ࠶ߟ • σʔλྔͷ૿ิ • จ຺ΛߟྀͰ͖Δ෼ྨϞσϧΛௐࠪ • σϞͷৄࡉʹ͍ͭͯ TPDJBMDPNQVUJOHPGGJDF!JTOBJTUKQ 2020/3/13 19