■イベント 言語処理学会第26回年次大会 https://www.anlp.jp/nlp2020/
■登壇概要 タイトル:ニュース記事からの企業ワード検索 発表者: DSOC 研究開発部 Data Analysis Group 奥田 裕樹
▼Sansan Builders Box https://buildersbox.corp-sansan.com/
ニュース記事からの企業キーワード抽出ϞνϕʔγϣϯԞా༟थɾߴڮ࣏ʢSansanגࣜձࣾ DSOCʣAlan Akbik, Duncan Blythe, and Roland Voll-graf. Contextual string embeddings for sequencelabeling.InCOLING 2018, 27th InternationalConference on Computational Linguistics, pp.1638{1649, 2018.Τϥʔੳʹ͓͚ΔχϡʔεهࣄͷҾ༻ݩɿɾhttps://forbesjapan.com/articles/detail/29451ɾhttps://prtimes.jp/main/html/rd/p/000000198.000011115.htmlɾhttps://m.finance.yahoo.co.jp/news/detail/20191001-00000004-scnf-stocksɾhttps://www.nikkan.co.jp/articles/view/00534784ɾhttps://prtimes.jp/main/html/rd/p/000003593.000003442.htmlAkbik et al., 2018ΑΓҾ༻• αʔϏε໊• ໊• ΣϒαΠτ໊• ӡӦ͢Δࢪઃ໊• ڌ໊• Πϕϯτ໊• ͏ͪاۀΩʔϫʔυީิ7,225݅ ʢਖ਼ྫ4,439݅ / ෛྫ2,786݅ʣ• ֶश:։ൃ:ςετ=8:1:1• ࣄۀ໊• ձ໊ࣾʢؔ࿈ʣ͋ΒΏΔاۀ׆ಈʹؔ͢ΔΩʔϫʔυΛࣗಈͰऩू͠ੵ͢ΔγεςϜͷߏஙख๏݁ՌఏҊख๏BiLSTM-CRF + Contextual String EmbeddingsϕʔεϥΠϯɾ ࠷සɾ લޙ10୯ޠͷBoW + SVM໊ΞϓϦEightɺاۀͷ՝ղܾΛޙԡ͢͠ΔϏδωεΠϕϯτʮMeetsʯΛൃද ʙϏδωεͷʮങ͍͍ͨʯͱʮചΓ͍ͨʯΛͭͳ͙ʙSansanגࣜձࣾɺಉ͕ࣾఏڙ͢Δ໊ΞϓϦʮEightʯ͔ΒɺϏδωεΠϕϯτʮMeetsʢϛʔπʣʯ͕ఏڙ͞Εͨ͜ͱΛൃද͠·͢ɻ MeetsɺEightͷςΫϊϩδʔΛ׆༻͠ɺαʔϏεΛʮങ͍͍ͨਓʯͱʮചΓ͍ͨਓʯͱΛͭͳ͗ɺࣾձͷੜ࢈ੑΛ্͛ΔϏδωεΠϕϯτͰ͢ɻλεΫϧʔϧʹΑΓࣗಈநग़ͨ͠اۀΩʔϫʔυީิʹର͢Δೋྨσʔληοτશ3,978݅ͷχϡʔεهࣄΞϊςʔγϣϯɹ৽iPhoneʮλονϖϯʯରԠͷՄೳੑɹʮ৽ฉʷARʯͷදݱΞΠσΞίϯςετɹϫʔΫϑϩʔΛిࢠԽ͢ΔʮϫʔΫϑϩʔγεςϜʯΛల։͍ͯ͠ΔΤϥʔੳاۀαʔϏε໊ͩͱޡఆɹץۀ৽ฉࣾൃߦͷ݄ץࢽʮཧʯɹ11݄߸Ͱɹʮं͍͢ͰؒͱҰา֎ʯΛ࢝ಈɺαοΧʔ؍ઓʹ͓͚Δं͍͢੮ͷՔಇΛߴΊΔऔΓΈΛ࣮ࢪاۀαʔϏε໊Ͱͳ͍ͱޡఆاۀΩʔϫʔυͷఆٛʮاۀ׆ಈͷதͰੜ·ΕͨϞϊαʔϏεΛද໊͢শʯ˝ҎԼͷ߲ΛاۀΩʔϫʔυͱఆٛχϡʔεهࣄΛऩूϧʔϧϕʔεͰاۀΩʔϫʔυީิΛநग़اۀΩʔϫʔυީิ͕ద͔Λೋྨʢϛʔπʣങ͍͍ͨਓചΓ͍ͨਓEightMeetsʢϛʔπʣEightMeetsMethod Precision Recall F1majority class 0.31 0.50 0.38BoW+SVM 0.75 0.72 0.73BiLSTM-CRF+CSE 0.87 0.82 0.83
View Slide