Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介 : How to Train good Word Embeddings for Biomedical NLP

T.Tada
September 26, 2018

文献紹介 : How to Train good Word Embeddings for Biomedical NLP

T.Tada

September 26, 2018
Tweet

More Decks by T.Tada

Other Decks in Technology

Transcript

  1. 文献紹介: 2018年9月26日 How to Train Good Word Embeddings for Biomedical

    NLP 長岡技術科学大学 自然言語処理研究室 多田太郎
  2. About the thesis 著者: Billy Chiu,Gamal Crichton,Anna Korhonen, Sampo Pyysalo

    Language Technology Lab DTAL, University of Cambridge 会議: Proceedings of the 15th Workshop on Biomedical Natural Language Processing, pages 166–174,2016 Association for Computational Linguistics
  3. Data set 3通りのコーパスから学習を行う 内部評価 単語の類似性と関連性を別々に測定 UMNSRS-Sim : 566 word pairs

    UMNSRS-Rel : 587 word pairs (Pakhomov et al.,2010) 外部評価 the BioCreative II Gene Mention task corpus (BC2) (Smith et al.,2008) the JNLPBA corpus (PBA) (Kim et al.,2004) Biomedical 固有名に手作業でアノテーションしたPubMedからの約2万文