Slide 1

Slide 1 text

文献紹介 End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis 鈴木脩右 2019/3/7 長岡技術科学大学 自然言語処理研究室 1

Slide 2

Slide 2 text

Reference [1] Lin Xu, Qixian Zhou, Ke Gong, Xiaodan Liang, Jianheng Tang, and Liang Lin. End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis. arXiv:1901.10623 [cs], January 2019. 2

Slide 3

Slide 3 text

Abstract

Slide 4

Slide 4 text

Abstract • 患者と対話し,病気の症状を自動診断する対話システムの 開発 • 既存の対話システムでは,会話データから学習するため, 外部のエキスパート知識を活用できない • 本研究では,End-to-End Knowledge-routed Relational Dialogue System (KR-DS) を提案 • 対話のトピック遷移を管理するため,Knowledge-routed Deep Q-network (KR-DQN) を提案 • 公開されている医療対話データセットで,SotA を診断正解 率で 8%以上上回り,新たに集めたデータセットにおいて も,優位性を示した 3

Slide 5

Slide 5 text

Introduction

Slide 6

Slide 6 text

Introduction 1 • 医療対話システムは医師を手助けできる可能性がある • 医療知識に基づいた対話および症状と疾患の関係を理解す る必要がある • 既存のタスク指向型対話システムでは外部知識を考慮して いない • 既存のデータセットでは E2E の対話学習には不十分 4

Slide 7

Slide 7 text

Introduction 2 • 医療知識グラフと症状・疾患関連を対話制御のトピック遷 移に取り込む KR-DS を提案 • 一般的に医師の診断は,医療知識と診断経験に基づく • 知識グラフと関連性改善を活用する KR-DQN を提案 • 自己申告を含む患者と医師の対話データの構築 • 2つの医療対話データにおける実験 5

Slide 8

Slide 8 text

本研究の貢献 1. 医療知識グラフを対話制御のトピック遷移に取り込む KR-DS の提案 2. 症状と症状-疾患ペアの関係のエンコードのための KR-DQN の提案 3. 自己申告を含む患者と医師の対話データの構築 4. 2つの医療対話データにおける実験において高い性能を示 した 6

Slide 9

Slide 9 text

提案手法

Slide 10

Slide 10 text

構成図 KR-DS は,言語理解 (NLU),言語生成 (NLG),対話管理 (DM) から 成る 7

Slide 11

Slide 11 text

NLU • 中国語でインテントおよびスロットの識別を行う (データ セットが中国語のため) • ユーザーのインテントは 4 タイプに分けられる (request+disease,confirm+symptom,deny+symptom, not-sure+symptom) • Bi-LSTM で各単語をタグ付けを行い,スロットとインテント を同時に識別 • 文脈理解は,ルールベースで管理し,症状状態を記憶 • 症状はスロットとして固定ベクトルで表現 • 事前トレーニング (教師あり学習) の後,強化学習を通じて 他のユニットと共同でトレーニング可能 8

Slide 12

Slide 12 text

方策学習 1 • ユーザーシミュレーターを通して対話制御を学習 • M の疾患と N の症状を考える • 状態 st は,ユーザーとエージェントの前回行動と既知の症 状表現と現在のターン情報を含む • 対話方策 π は,状態 st を受け取り,行動決定 π(at |st ) 9

Slide 13

Slide 13 text

方策学習 2 • Basic DQN 状態 st を入力として行動を予測 • Relational Refinement 前行動の依存性から,関連性改善モジュールをデザインする • Knowledge-routed Graph 2 つのノード(疾患と症状)を持ち,医療知識グラフの重み として,疾患と症状間の条件付き確率を計算する 10

Slide 14

Slide 14 text

実験

Slide 15

Slide 15 text

データセット • MZ dataset(既存データセット) • 4 種の疾患と 66 の症状を含む • ユーザーゴールしか含まれない • ユーザーシミュレーターとエラーモデルを利用して DM モデルを 学習 • DX Medical Dialogue Dataset • 医師が診断を行う中国サイトでデータを収集 • 5 種の疾患と 41 の症状が含まれた 527 対話 • アノテーターには医療知識のある 4 人を採用 11

Slide 16

Slide 16 text

実験結果 12

Slide 17

Slide 17 text

人的評価 3人の医療関係者を読んで,3つの要素で比較してもらった. 1.診断の妥当性,2.最終診断の正しさ,3.対話の流暢さ, これらを1− 5点で評価.104対話が3人によって評価され た.すべての項目で一番良い結果になった. 13

Slide 18

Slide 18 text

定性分析 • 1 つ目の例では,ベースラインはいきなり診察を下してい る.KR-DS は,他にも考えられる疾患を検討している • 2つ目の例ではベースラインは,医療知識がないため正し い疾患に関連しない質問を繰り返している. 14

Slide 19

Slide 19 text

Conclusions

Slide 20

Slide 20 text

Conclusions • 対話管理、自然言語理解、および自然言語生成を強化学習に よって協調的に最適化することを可能にする KR-DS を提案 • トピック遷移を管理する KR-DQN を提案 • 医師と患者の対話データセットを構築 • 既存データセットおよび構築データセットにおいて,高い 性能を示した 15