Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介_202002_Is artificial data useful for biomedical Natural Language Processing algorithms?

T.Tada
February 10, 2020

文献紹介_202002_Is artificial data useful for biomedical Natural Language Processing algorithms?

T.Tada

February 10, 2020
Tweet

More Decks by T.Tada

Other Decks in Technology

Transcript

  1. - 文献紹介 2020 Feb. 10 - Is artificial data useful

    for biomedical Natural Language Processing algorithms? 長岡技術科学大学 自然言語処理研究室 多田太郎
  2. 時間関係データセット 2012 i2b2 temporal relations shared task (Sun et al., 2013b)

     190文書の退院サマリ 開発:10%(dev-temp)、  残りは疑似データのテストとトレーニングに使用(test-gen-temp)  テスト:元々のデータのテスト 時間表現に関する病歴のイベントの相対的な順序を決定するタスク   イベント(EVENT)、時間表現(TIMEEX3)、それらの時間的関係(TLINK)が注釈   この研究ではイベントが同時に起きているか(注釈された関係性の33%)を予測   頻度1の単語はプレースホルダーに 9 Experimental Setup -Data-
  3. 10 Experimental Setup -Text Generation Models- ・Transformerモデルを使用し、文生成 OpenNMTツールキット(Klein et al.,2017)

    ・抽出されたキーフレーズを用いて生成(キーフレーズはtrain-genから抽出) Rakeアルゴリズム(Rose et al., 2010)を使用   段落ごとに高いスコアから50%取得 ・各文から抽出されたキーフレーズを入力に   一文当たり平均2.4キーフレーズ、平均の長さ1.7語
  4. 時間関係抽出 ・BiLSTM classifier pre-trained GloVe word embeddings ・Naive Bayes classifier

    (ワードレベルのBoW) イベントとイベントごとにoverlapしているか否かの2値分類 13 Experimental Setup -Models for Temporal Relations Extraction-