Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介:End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis

文献紹介:End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis

長岡技術科学
自然言語処理研究室
B3ゼミ
鈴木脩右

shu_suzuki

March 07, 2019
Tweet

More Decks by shu_suzuki

Other Decks in Technology

Transcript

  1. Reference [1] Lin Xu, Qixian Zhou, Ke Gong, Xiaodan Liang,

    Jianheng Tang, and Liang Lin. End-to-End Knowledge-Routed Relational Dialogue System for Automatic Diagnosis. arXiv:1901.10623 [cs], January 2019. 2
  2. Abstract • 患者と対話し,病気の症状を自動診断する対話システムの 開発 • 既存の対話システムでは,会話データから学習するため, 外部のエキスパート知識を活用できない • 本研究では,End-to-End Knowledge-routed

    Relational Dialogue System (KR-DS) を提案 • 対話のトピック遷移を管理するため,Knowledge-routed Deep Q-network (KR-DQN) を提案 • 公開されている医療対話データセットで,SotA を診断正解 率で 8%以上上回り,新たに集めたデータセットにおいて も,優位性を示した 3
  3. Introduction 2 • 医療知識グラフと症状・疾患関連を対話制御のトピック遷 移に取り込む KR-DS を提案 • 一般的に医師の診断は,医療知識と診断経験に基づく •

    知識グラフと関連性改善を活用する KR-DQN を提案 • 自己申告を含む患者と医師の対話データの構築 • 2つの医療対話データにおける実験 5
  4. 本研究の貢献 1. 医療知識グラフを対話制御のトピック遷移に取り込む KR-DS の提案 2. 症状と症状-疾患ペアの関係のエンコードのための KR-DQN の提案 3.

    自己申告を含む患者と医師の対話データの構築 4. 2つの医療対話データにおける実験において高い性能を示 した 6
  5. NLU • 中国語でインテントおよびスロットの識別を行う (データ セットが中国語のため) • ユーザーのインテントは 4 タイプに分けられる (request+disease,confirm+symptom,deny+symptom,

    not-sure+symptom) • Bi-LSTM で各単語をタグ付けを行い,スロットとインテント を同時に識別 • 文脈理解は,ルールベースで管理し,症状状態を記憶 • 症状はスロットとして固定ベクトルで表現 • 事前トレーニング (教師あり学習) の後,強化学習を通じて 他のユニットと共同でトレーニング可能 8
  6. 方策学習 1 • ユーザーシミュレーターを通して対話制御を学習 • M の疾患と N の症状を考える •

    状態 st は,ユーザーとエージェントの前回行動と既知の症 状表現と現在のターン情報を含む • 対話方策 π は,状態 st を受け取り,行動決定 π(at |st ) 9
  7. 方策学習 2 • Basic DQN 状態 st を入力として行動を予測 • Relational

    Refinement 前行動の依存性から,関連性改善モジュールをデザインする • Knowledge-routed Graph 2 つのノード(疾患と症状)を持ち,医療知識グラフの重み として,疾患と症状間の条件付き確率を計算する 10
  8. データセット • MZ dataset(既存データセット) • 4 種の疾患と 66 の症状を含む •

    ユーザーゴールしか含まれない • ユーザーシミュレーターとエラーモデルを利用して DM モデルを 学習 • DX Medical Dialogue Dataset • 医師が診断を行う中国サイトでデータを収集 • 5 種の疾患と 41 の症状が含まれた 527 対話 • アノテーターには医療知識のある 4 人を採用 11
  9. Conclusions • 対話管理、自然言語理解、および自然言語生成を強化学習に よって協調的に最適化することを可能にする KR-DS を提案 • トピック遷移を管理する KR-DQN を提案

    • 医師と患者の対話データセットを構築 • 既存データセットおよび構築データセットにおいて,高い 性能を示した 15