Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介201904_Biomedical Document Retrieval for Clinical Decision Support System

T.Tada
April 23, 2019

文献紹介201904_Biomedical Document Retrieval for Clinical Decision Support System

T.Tada

April 23, 2019
Tweet

More Decks by T.Tada

Other Decks in Technology

Transcript

  1. - 文献紹介 2019/4/23 - Biomedical Document Retrieval for Clinical Decision

    Support System 長岡技術科学大学 自然言語処理研究室 多田太郎
  2. Introduction and Motivation ・毎年数千の生物医学分野の論文が発表されている ・これらは患者ケアのため、臨床決定支援システムのコレクションとして使用できる ・データセット:Clinical Decision Support(CDS)トラック PMC(PubMed Central)からの何百万もの全文生物医学論文を含む

    患者の症例報告に関連する生物医学論文の検索に焦点を当てている 患者の病状、病歴、症状、実施された検査、治療などが記述 ・与えられたクエリ(症例報告)に関して、主な問題は利用可能なコレクションから関連する 文書を見つけランク付けすること 4
  3. Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案 ・Automatic Query Expansion

    With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation   6
  4. Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案 ・Automatic Query Expansion

    With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation   7
  5. Automatic Query Expansion With Pseudo Relevance Feedback & Relevance Feedback

    生物医学的ドメインに対するクエリ拡張ベースのアプローチは、クエリー拡張なしの検索と比 較してより良い結果(Sankhavara et al.,2014) ・関連性フィードバック(RF) 検索された上位の文書から人手により関連する文書を選択 ・擬似関連性フィードバック(PRF) 検索されたトップ文書に関連性があると仮定し、フィードバック文書として使用 Terrier IR Plateform 3(Ounis et al.,2005)で実装されたモデルを使用 8
  6. Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案 ・Automatic Query Expansion

    With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation   11
  7. Feedback Document Discovery for Query Reformulation フィードバック文書発見ベースのクエリ拡張 上位の検索された文書からクエリ拡張に関連する文書を識別することを学習 少量の人手の判断により、他のドキュメントの疑似判断を学ぶことが目的 1.

    classification ベース 2. classification + clustering ベース 13 フィードバック文書の中に人手のアノテーションがある場合は、トレーニングデータとする 文書は以下で表される  bag-of-words、TF-IDFスコア、人間アノテーションからのクラス 検索されたフィードバック文書について関連性を予測
  8. Feedback Document Discovery for Query Reformulation フィードバック文書発見ベースのクエリ拡張 上位の検索された文書からクエリ拡張に関連する文書を識別することを学習 少量の人手の判断により、他のドキュメントの疑似判断を学ぶことが目的 1.

    classification ベース 2. classification + clustering ベース 14 1.classificationベースのアプローチと同様の方法で分類 2.関連性予測クラスを基にクラスタリング(K平均法: k=2) →関連するものからより関連性の低いドキュメントを除外する
  9. Feedback Document Discovery for Query Reformulation CliNER tool (Boag et

    al., 2015)を使用 トレーニング: ’discharge summaries’ とそれらの ’concept annotations’ 識別対象: CDS文書の’problem’, ’test’ and ’treatment’ 方法 1. 予測した上位50の文書とそれらの対応する関連文書を使用しトレーニング 2. 予測した上位200の文書から関連するものを使用しクエリ拡張 15
  10. Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案 ・Automatic Query Expansion

    With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation   17
  11. UMLS Concepts Based Query Reformulation 次の3つのQuery Reformulation実験を行う 1. クエリテキストからUMLSの概念を識別し、クエリと共に使用 2. MeSH(Medical Subject

    Heading)の用語も識別し、クエリで使用  →MeSHはUMLSの階層的に構成された語彙 3. 手動で識別し、クエリと共に使用 19