文献紹介201904_Biomedical Document Retrieval for Clinical Decision Support System

- 文献紹介 2019/4/23 - Biomedical Document Retrieval for Clinical Decision
Support System 長岡技術科学大学自然言語処理研究室多田太郎

About the paper 2 Authors： Conference：

Abstract ・臨床意思決定支援システム（CDSS）のため、生物医学文献の検索に焦点を当てる・クエリ拡張の統計的アプローチとNLPアプローチ・順序学習問題として生物医学文書検索をモデル化 3

Introduction and Motivation ・毎年数千の生物医学分野の論文が発表されている・これらは患者ケアのため、臨床決定支援システムのコレクションとして使用できる・データセット：Clinical Decision Support（CDS）トラック PMC（PubMed Central）からの何百万もの全文生物医学論文を含む
患者の症例報告に関連する生物医学論文の検索に焦点を当てている患者の病状、病歴、症状、実施された検査、治療などが記述・与えられたクエリ（症例報告）に関して、主な問題は利用可能なコレクションから関連する文書を見つけランク付けすること 4

Introduction and Motivation 5

Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案・Automatic Query Expansion
With Pseudo Relevance Feedback & Relevance Feedback ・Feedback Document Discovery for Query Reformulation ・UMLS Concepts Based Query Reformulation 　 6

Automatic Query Expansion With Pseudo Relevance Feedback & Relevance Feedback
生物医学的ドメインに対するクエリ拡張ベースのアプローチは、クエリー拡張なしの検索と比較してより良い結果（Sankhavara et al.,2014）・関連性フィードバック（RF）検索された上位の文書から人手により関連する文書を選択・擬似関連性フィードバック（PRF）検索されたトップ文書に関連性があると仮定し、フィードバック文書として使用 Terrier IR Plateform 3（Ounis et al.,2005）で実装されたモデルを使用 8

9

10

Feedback Document Discovery for Query Reformulation フィードバック文書発見ベースのクエリ拡張 →検索結果が上位の文書からクエリ拡張に関連する文書を識別することを学習少量の人手の判断により、他のドキュメントの疑似判断を学ぶことが目的以下２つの方法で実験
１． classiﬁcation ベース（nearest neighbour，neural net） 2． classiﬁcation + clustering ベース（上記+ k-means ） 12

Feedback Document Discovery for Query Reformulation フィードバック文書発見ベースのクエリ拡張上位の検索された文書からクエリ拡張に関連する文書を識別することを学習少量の人手の判断により、他のドキュメントの疑似判断を学ぶことが目的１．
classiﬁcation ベース 2． classiﬁcation + clustering ベース 13 フィードバック文書の中に人手のアノテーションがある場合は、トレーニングデータとする文書は以下で表される　bag-of-words、TF-IDFスコア、人間アノテーションからのクラス検索されたフィードバック文書について関連性を予測

Feedback Document Discovery for Query Reformulation フィードバック文書発見ベースのクエリ拡張上位の検索された文書からクエリ拡張に関連する文書を識別することを学習少量の人手の判断により、他のドキュメントの疑似判断を学ぶことが目的１．
classification ベース 2． classification + clustering ベース 14 1.classificationベースのアプローチと同様の方法で分類 2.関連性予測クラスを基にクラスタリング（Ｋ平均法: k=2） →関連するものからより関連性の低いドキュメントを除外する

Feedback Document Discovery for Query Reformulation CliNER tool (Boag et
al., 2015)を使用トレーニング： ’discharge summaries’ とそれらの ’concept annotations’ 識別対象： CDS文書の’problem’, ’test’ and ’treatment’ 方法１．　予測した上位50の文書とそれらの対応する関連文書を使用しトレーニング２．　予測した上位200の文書から関連するものを使用しクエリ拡張 15

Feedback Document Discovery for Query Reformulation 16

UMLS Concepts Based Query Reformulation ・医療分野の知識を、IRシステムにおけるクエリ拡張プロセスに組み込む・医学言語システム（UMLS）（Bodenreider,2004年）医学分野のメタシソーラスを使用 →国立医学図書館（NLM）によって維持される　 →100以上の辞書、用語集、およびオントロジーを統合した包括的なリソース
　 18

UMLS Concepts Based Query Reformulation 次の3つのQuery Reformulation実験を行う 1.　クエリテキストからUMLSの概念を識別し、クエリと共に使用 2.　MeSH（Medical Subject
Heading）の用語も識別し、クエリで使用　→MeSHはUMLSの階層的に構成された語彙 3.　手動で識別し、クエリと共に使用 19

UMLS Concepts Based Query Reformulation 20

Learning To Rank ・OHSUMED LETOR（Qin et al.,2010）を参考にLTRフレームワークを適用　→クエリとそれに対するドキュメントを関連度と共にトレーニング・文書プールが大きいため、各クエリごとに上位25の文書（BM25による）を特徴抽出に使用・オリジナルのクエリ、UMLSによるクエリ、手動で識別された医療概念によるクエリで実験
・手作業の必要性を克服するために、擬似的な特徴を使った実験も行う →k個のトレーニング文書　上位k / 2の文書を関連性あり、下位k / 2個の文書が関連性なし 21

Learning To Rank 22

Learning To Rank 23

Conclusion ・臨床意思決定支援システムのための生物医学文献検索の基礎となる研究を提示・生物医学文書検索でのクエリ拡張に基づく情報検索フレームワークの有用性を示した・標準的なIRフレームワークPRFとRFは、臨床意思決定支援システムで十分に機能する・UMLSのコンセプトを使った検索のための初期フレームワークも結果の改善を示した 24

Feedback Document Discovery for Query Reformulation 25

文献紹介201904_Biomedical Document Retrieval for Cl...

文献紹介201904_Biomedical Document Retrieval for Clinical Decision Support System

T.Tada

More Decks by T.Tada

Other Decks in Technology

Featured

Transcript

- 文献紹介 2019/4/23 - Biomedical Document Retrieval for Clinical Decision

About the paper 2 Authors： Conference：

Abstract ・臨床意思決定支援システム（CDSS）のため、生物医学文献の検索に焦点を当てる・クエリ拡張の統計的アプローチとNLPアプローチ・順序学習問題として生物医学文書検索をモデル化 3

Introduction and Motivation 5

Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案・Automatic Query Expansion

Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案・Automatic Query Expansion

Automatic Query Expansion With Pseudo Relevance Feedback & Relevance Feedback

Automatic Query Expansion With Pseudo Relevance Feedback & Relevance Feedback

Automatic Query Expansion With Pseudo Relevance Feedback & Relevance Feedback

Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案・Automatic Query Expansion

Feedback Document Discovery for Query Reformulation CliNER tool (Boag et

Feedback Document Discovery for Query Reformulation 16

Query Reformulation for Biomedical Document Retrieval 統計的およびNLPベースのアプローチを提案・Automatic Query Expansion

UMLS Concepts Based Query Reformulation 次の3つのQuery Reformulation実験を行う 1.　クエリテキストからUMLSの概念を識別し、クエリと共に使用 2.　MeSH（Medical Subject

UMLS Concepts Based Query Reformulation 20

Learning To Rank 22

Learning To Rank 23

Feedback Document Discovery for Query Reformulation 25