$30 off During Our Annual Pro Sale. View Details »

文献紹介201904_Biomedical Document Retrieval for Clinical Decision Support System

T.Tada
April 23, 2019

文献紹介201904_Biomedical Document Retrieval for Clinical Decision Support System

T.Tada

April 23, 2019
Tweet

More Decks by T.Tada

Other Decks in Technology

Transcript

  1. - 文献紹介 2019/4/23 - Biomedical Document Retrieval for Clinical Decision

    Support System 長岡技術科学大学 自然言語処理研究室 多田太郎
  2. About the paper 2 Authors: Conference:

  3. Abstract ・臨床意思決定支援システム(CDSS)のため、生物医学文献の検索に焦点を当てる ・クエリ拡張の統計的アプローチとNLPアプローチ ・順序学習問題として生物医学文書検索をモデル化 3

  4. Introduction and Motivation ・毎年数千の生物医学分野の論文が発表されている ・これらは患者ケアのため、臨床決定支援システムのコレクションとして使用できる ・データセット:Clinical Decision Support(CDS)トラック PMC(PubMed Central)からの何百万もの全文生物医学論文を含む

    患者の症例報告に関連する生物医学論文の検索に焦点を当てている 患者の病状、病歴、症状、実施された検査、治療などが記述 ・与えられたクエリ(症例報告)に関して、主な問題は利用可能なコレクションから関連する 文書を見つけランク付けすること 4
  5. Introduction and Motivation 5

  6. Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案 ・Automatic Query Expansion

    With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation   6
  7. Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案 ・Automatic Query Expansion

    With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation   7
  8. Automatic Query Expansion With Pseudo Relevance Feedback & Relevance Feedback

    生物医学的ドメインに対するクエリ拡張ベースのアプローチは、クエリー拡張なしの検索と比 較してより良い結果(Sankhavara et al.,2014) ・関連性フィードバック(RF) 検索された上位の文書から人手により関連する文書を選択 ・擬似関連性フィードバック(PRF) 検索されたトップ文書に関連性があると仮定し、フィードバック文書として使用 Terrier IR Plateform 3(Ounis et al.,2005)で実装されたモデルを使用 8
  9. Automatic Query Expansion With Pseudo Relevance Feedback & Relevance Feedback

    9
  10. Automatic Query Expansion With Pseudo Relevance Feedback & Relevance Feedback

    10
  11. Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案 ・Automatic Query Expansion

    With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation   11
  12. Feedback Document Discovery for Query Reformulation フィードバック文書発見ベースのクエリ拡張 →検索結果が上位の文書からクエリ拡張に関連する文書を識別することを学習 少量の人手の判断により、他のドキュメントの疑似判断を学ぶことが目的 以下2つの方法で実験

    1. classification ベース(nearest neighbour,neural net) 2. classification + clustering ベース(上記+ k-means ) 12
  13. Feedback Document Discovery for Query Reformulation フィードバック文書発見ベースのクエリ拡張 上位の検索された文書からクエリ拡張に関連する文書を識別することを学習 少量の人手の判断により、他のドキュメントの疑似判断を学ぶことが目的 1.

    classification ベース 2. classification + clustering ベース 13 フィードバック文書の中に人手のアノテーションがある場合は、トレーニングデータとする 文書は以下で表される  bag-of-words、TF-IDFスコア、人間アノテーションからのクラス 検索されたフィードバック文書について関連性を予測
  14. Feedback Document Discovery for Query Reformulation フィードバック文書発見ベースのクエリ拡張 上位の検索された文書からクエリ拡張に関連する文書を識別することを学習 少量の人手の判断により、他のドキュメントの疑似判断を学ぶことが目的 1.

    classification ベース 2. classification + clustering ベース 14 1.classificationベースのアプローチと同様の方法で分類 2.関連性予測クラスを基にクラスタリング(K平均法: k=2) →関連するものからより関連性の低いドキュメントを除外する
  15. Feedback Document Discovery for Query Reformulation CliNER tool (Boag et

    al., 2015)を使用 トレーニング: ’discharge summaries’ とそれらの ’concept annotations’ 識別対象: CDS文書の’problem’, ’test’ and ’treatment’ 方法 1. 予測した上位50の文書とそれらの対応する関連文書を使用しトレーニング 2. 予測した上位200の文書から関連するものを使用しクエリ拡張 15
  16. Feedback Document Discovery for Query Reformulation 16

  17. Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案 ・Automatic Query Expansion

    With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation   17
  18. UMLS Concepts Based Query Reformulation ・医療分野の知識を、IRシステムにおけるクエリ拡張プロセスに組み込む ・医学言語システム(UMLS)(Bodenreider,2004年)医学分野のメタシソーラスを使用 →国立医学図書館(NLM)によって維持される   →100以上の辞書、用語集、およびオントロジーを統合した包括的なリソース

      18
  19. UMLS Concepts Based Query Reformulation 次の3つのQuery Reformulation実験を行う 1. クエリテキストからUMLSの概念を識別し、クエリと共に使用 2. MeSH(Medical Subject

    Heading)の用語も識別し、クエリで使用  →MeSHはUMLSの階層的に構成された語彙 3. 手動で識別し、クエリと共に使用 19
  20. UMLS Concepts Based Query Reformulation 20

  21. Learning To Rank ・OHSUMED LETOR(Qin et al.,2010)を参考にLTRフレームワークを適用  →クエリとそれに対するドキュメントを関連度と共にトレーニング ・文書プールが大きいため、各クエリごとに上位25の文書(BM25による)を特徴抽出に使用 ・オリジナルのクエリ、UMLSによるクエリ、手動で識別された医療概念によるクエリで実験

    ・手作業の必要性を克服するために、擬似的な特徴を使った実験も行う →k個のトレーニング文書  上位k / 2の文書を関連性あり、下位k / 2個の文書が関連性なし 21
  22. Learning To Rank 22

  23. Learning To Rank 23

  24. Conclusion ・臨床意思決定支援システムのための生物医学文献検索の基礎となる研究を提示 ・生物医学文書検索でのクエリ拡張に基づく情報検索フレームワークの有用性を示した ・標準的なIRフレームワークPRFとRFは、臨床意思決定支援システムで十分に機能する ・UMLSのコンセプトを使った検索のための初期フレームワークも結果の改善を示した 24

  25. Feedback Document Discovery for Query Reformulation 25