Data Strategy and Operation Center ニュース記事内から企業名を正しく抽出することが必要 様々な企業名が存在するなかで 記事中に含まれる企業名を瞬時に抽出 5 同名企業の曖昧性を解消し ニュース記事が⾔及する企業を同定 企業名 Sansan株式会社 正確な企業名抽出 同名企業の区別
Data Strategy and Operation Center 結果 10 Model Dictionary Character Features Test Easy Test Hard Precision Recall F1 Precision Recall F1 Average F1 Exact Match - - 0.346 0.779 0.480 0.172 0.262 0.208 0.344 BiLSTM-CRF IPADic No 0.870 0.827 0.848 0.830 0.793 0.811 0.830 BiLSTM-CRF Unidic No 0.865 0.811 0.837 0.845 0.769 0.804 0.821 BiLSTM-CRF IPADic Yes 0.839 0.862 0.850 0.855 0.786 0.819 0.835 ベースラインの辞書マッチと⽐較して⾼い精度 単語に含まれる⽂字情報を追加したモデルが最も精度が良くなった