Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介_20181024_An Empirical Evaluation of doc2vec with Practical Insights into Document Embedding Generation

T.Tada
October 24, 2018

文献紹介_20181024_An Empirical Evaluation of doc2vec with Practical Insights into Document Embedding Generation

T.Tada

October 24, 2018
Tweet

More Decks by T.Tada

Other Decks in Technology

Transcript

  1. - 文献紹介 2018/10/24 - An Empirical Evaluation of doc2vec with

    Practical Insights into Document Embedding Generation 長岡技術科学大学 自然言語処理研究室 多田太郎
  2. About the thesis Authors : Jey Han Lau, Timothy Baldwin

    IBM Research Conference : Proceedings of the 1st Workshop on Representation Learning for NLP, pages 78–86, 2016 Association for Computational Linguistics 2
  3. Evaluation Tasks 1. Forum Question Duplication 2. Semantic Textual Similarity

    SEMとSemEvalの一部のshared task 文章のペアの類似性を求めるタスク 5 ドメイン, 各ドメイン 375 から 750のアノテートされたペアがある 8
  4. Optimal Hyper-parameter Settings Training with Large External Corpora これまでの実験で結果の良かった dbow

    で実験 開発データを使用して以下のパラメータを固定し最適化  ・ initial learning rate : 0.025  ・ minimum learning rate : 0.0001 大規模な外部コーパスでの学習による有効性を検証  ・ English Wikipedia  ・ Associated Press English news articles from 2009 to 2015. 10
  5. 12