文献紹介:End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis

文献紹介 End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis 鈴木脩右
2019/3/7 長岡技術科学大学自然言語処理研究室 1

Reference [1] Lin Xu, Qixian Zhou, Ke Gong, Xiaodan Liang,
Jianheng Tang, and Liang Lin. End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis. arXiv:1901.10623 [cs], January 2019. 2

Abstract

Abstract • 患者と対話し，病気の症状を自動診断する対話システムの開発 • 既存の対話システムでは，会話データから学習するため，外部のエキスパート知識を活用できない • 本研究では，End-to-End Knowledge-routed
Relational Dialogue System (KR-DS) を提案 • 対話のトピック遷移を管理するため，Knowledge-routed Deep Q-network (KR-DQN) を提案 • 公開されている医療対話データセットで，SotA を診断正解率で 8%以上上回り，新たに集めたデータセットにおいても，優位性を示した 3

Introduction

Introduction 1 • 医療対話システムは医師を手助けできる可能性がある • 医療知識に基づいた対話および症状と疾患の関係を理解する必要がある • 既存のタスク指向型対話システムでは外部知識を考慮していない
• 既存のデータセットでは E2E の対話学習には不十分 4

Introduction 2 • 医療知識グラフと症状・疾患関連を対話制御のトピック遷移に取り込む KR-DS を提案 • 一般的に医師の診断は，医療知識と診断経験に基づく •
知識グラフと関連性改善を活用する KR-DQN を提案 • 自己申告を含む患者と医師の対話データの構築 • ２つの医療対話データにおける実験 5

本研究の貢献 1. 医療知識グラフを対話制御のトピック遷移に取り込む KR-DS の提案 2. 症状と症状-疾患ペアの関係のエンコードのための KR-DQN の提案 3.
自己申告を含む患者と医師の対話データの構築 4. ２つの医療対話データにおける実験において高い性能を示した 6

提案手法

構成図 KR-DS は，言語理解 (NLU)，言語生成 (NLG)，対話管理 (DM) から成る 7

NLU • 中国語でインテントおよびスロットの識別を行う (データセットが中国語のため) • ユーザーのインテントは 4 タイプに分けられる (request+disease，confirm+symptom，deny+symptom，
not-sure+symptom) • Bi-LSTM で各単語をタグ付けを行い，スロットとインテントを同時に識別 • 文脈理解は，ルールベースで管理し，症状状態を記憶 • 症状はスロットとして固定ベクトルで表現 • 事前トレーニング (教師あり学習) の後，強化学習を通じて他のユニットと共同でトレーニング可能 8

方策学習 1 • ユーザーシミュレーターを通して対話制御を学習 • M の疾患と N の症状を考える •
状態 st は，ユーザーとエージェントの前回行動と既知の症状表現と現在のターン情報を含む • 対話方策 π は，状態 st を受け取り，行動決定 π(at |st ) 9

方策学習 2 • Basic DQN 状態 st を入力として行動を予測 • Relational
Refinement 前行動の依存性から，関連性改善モジュールをデザインする • Knowledge-routed Graph 2 つのノード（疾患と症状）を持ち，医療知識グラフの重みとして，疾患と症状間の条件付き確率を計算する 10

実験

データセット • MZ dataset(既存データセット) • 4 種の疾患と 66 の症状を含む •
ユーザーゴールしか含まれない • ユーザーシミュレーターとエラーモデルを利用して DM モデルを学習 • DX Medical Dialogue Dataset • 医師が診断を行う中国サイトでデータを収集 • 5 種の疾患と 41 の症状が含まれた 527 対話 • アノテーターには医療知識のある 4 人を採用 11

実験結果 12

人的評価３人の医療関係者を読んで，３つの要素で比較してもらった．１．診断の妥当性，２．最終診断の正しさ，３．対話の流暢さ，これらを１− ５点で評価．１０４対話が３人によって評価された．すべての項目で一番良い結果になった． 13

定性分析 • 1 つ目の例では，ベースラインはいきなり診察を下している．KR-DS は，他にも考えられる疾患を検討している • ２つ目の例ではベースラインは，医療知識がないため正しい疾患に関連しない質問を繰り返している． 14

Conclusions

Conclusions • 対話管理、自然言語理解、および自然言語生成を強化学習によって協調的に最適化することを可能にする KR-DS を提案 • トピック遷移を管理する KR-DQN を提案
• 医師と患者の対話データセットを構築 • 既存データセットおよび構築データセットにおいて，高い性能を示した 15

文献紹介:End-to-End Knowledge-Routed Relational Dia...

文献紹介:End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis

shu_suzuki

More Decks by shu_suzuki

Other Decks in Technology

Featured

Transcript