Slide 1

Slide 1 text

Automatic Discharge Summary Generation using Neural Network Models Kenichiro Ando Komachi lab ത࢜࿦จެௌձ  (ニューラルネットワークを用いた退院サマリーの自動生成)

Slide 2

Slide 2 text

- 診療⽂書作成は医師にとって⼤きな負担 Χϧςɺ঺հঢ়ɺ਍அॻɺखज़ه࿥ɺୀӃαϚϦʔ  - 患者と接する時間が削られる • ױऀͱ઀͢Δ࣌ؒ dIXFFL ɿQBQFSXPSL dIXFFL 2 Introduction Family physicians spent 5.9 hours in an 11.4 hour workday on EHRs operation. [1] Physicians spent 26.6% of their daily working time on documentation tasks. [2] 74 % of physicians spent more than 10 hours on paperwork per week. [3] https://www.medscape.com/slideshow/2019-compensation-overview-6011286

Slide 3

Slide 3 text

- 退院サマリーを作成する負荷は診療⽂書の中でも特に⼤きい • ೖӃதͷ༷ʑͳจॻΛࢀর͢Δඞཁ ˠ ⾃動要約で緩和したい 3 Introduction︓退院サマリー ⼊院カルテ 退院サマリー ⼊院中、毎⽇レポートが積み上げられる 他機関との情報共有のため、退院時に短くまとめる

Slide 4

Slide 4 text

- 近年はニューラルネットワークモデルが要約タスクにおいて優れた性能 → 退院サマリー⽣成にも適⽤され始めている • <%JBT > ױऀͷ਍ྍ࿥Λೖྗʹ͠ɺױऀͷ5'*%'Ϋϥελͱจॻ࡞੒ऀ৘ใΛ ϞσϧʹΤϯίʔυͯ͠ɺந৅తख๏ͰୀӃαϚϦʔੜ੒ • <4IJOH > ௕͍ೖྗʹରԠ͢ΔͨΊɺநग़ˠந৅ཁ໿ͷೋஈ֊ख๏ΛఏҊ • <"EBNT > طଘͷநग़ɺந৅ཁ໿ख๏Λద༻͠ɺΧϧςσʔληοτͱҰൠυϝ Πϯͱͷҧ͍Λ෼ੳ 4 Introduction︓先⾏研究

Slide 5

Slide 5 text

① ⽇本語 パラレルデータ(⼊院カルテ︓退院サマリー)が不⾜している → 退院サマリー⽣成にニューラルモデルを⽤いた研究が⾏われていない ② 医療⽂書を扱う際の最適な形態はなにか ③ ⼀般ドメインの要約タスクと⽐べてどのような特性があるか 5 Introduction︓課題 国立病院機構 144病院 セキュリティルーム 匿名化 解析サーバ 診療情報集積基盤 (NCDA) 国立病院機構 独立行政法人国立病院機構の保有する日本最大の多機関データの一部を用 いて、ニューラルモデルを用いた退院サマリー生成における特徴を調査 ੑ࣭͕ෆ໌ʢӳޠʹ͓͍ͯ΋ಉ༷ʣ

Slide 6

Slide 6 text

1. 評価⽤ダミーレコード作成(Chapter 3) ΞϊςʔγϣϯͷͨΊʹμϛʔͷೖӃΧϧςͱୀӃαϚϦʔͷσʔληοτΛ࡞੒ɻ 2. Clinical segmentの開発(Chapter 4) ͷ࣮ݧɺ ͷΞϊςʔγϣϯͷͨΊʹจΛҩྍతҙຯͰ෼ׂ͢ΔΑ͏ͳTFHNFOUΛ։ൃ 3. Clinical role labelの開発(Chapter 5) ͷ෼ੳͷͨΊʹDMJOJDBMTFHNFOUʹରͯ͠໾ׂΛ෇༩͢ΔΑ͏ͳDMJOJDBMSPMFMBCFMΛ։ൃ 4. 抽出的要約に最適な⼊⼒粒度の探索(Chapter 6) நग़తཁ໿Ϟσϧʹೖྗ͢ΔͨΊͷ࠷దͳཻ౓ΛɺจɺઅɺDMJOJDBMTFHNFOU͔Β୳ࡧ 5. 抽象的要約にメタ情報は有⽤なのか(Chapter 7) ந৅తཁ໿Ϟσϧʹҩࢣ৘ใ΍࣬ױ৘ใͳͲΛΤϯίʔυ͢Δͱਫ਼౓޲্͢Δͷ͔ௐࠪ 6. ソースが⼊院カルテのみで退院サマリー⽣成は可能なのか(Chapter 8) ୀӃαϚϦʔΛߏ੒͢ΔͨΊͷιʔεจॻͱͯ͠ͲͷΑ͏ͳछྨ͕ඞཁ͔Λௐࠪ 6 説明するトピックと論⽂との対応(⽬次) 課題① 課題② 課題③

Slide 7

Slide 7 text

1. 評価⽤ダミーレコード作成(Chapter 3) 2. Clinical segmentの開発(Chapter 4) 3. Clinical role labelの開発(Chapter 5) 4. 抽出的要約に最適な⼊⼒粒度の探索(Chapter 6) 5. 抽象的要約にメタ情報は有⽤なのか(Chapter 7) 6. ソースが⼊院カルテのみで退院サマリー⽣成は可能なのか(Chapter 8) 7 ⽬次

Slide 8

Slide 8 text

- NHO(国⽴病院機構)データ • ͭͷපӃ͔Βऩू͞Εͨ ঱ྫ • ෆ׬શͳಗ໊ԽͰ/)0಺ͷηΩϡϦςΟϧʔϜͰͷΈӾཡՄೳ → プライバシーの問題があり、⼀般に利⽤可能でないのでアノテーションが困難 - ダミーレコード • ҩࢣ͕࡞੒ͨ͠Ծ૝ͷױऀʹجͮ͘ೖӃΧϧςͱୀӃαϚϦʔ • ঱ྫ • ϓϥΠόγʔͷ੍໿͕ͳ͍ • ҩྍैࣄऀʹΑΔจ෼ׂɺೖୀӃ೔ɺ࣬ױ໊ɺ*$%ίʔυͳͲͷ৘ใఴՃ 8 ダミーレコード作成: NHOデータとの⽐較

Slide 9

Slide 9 text

- ⼊院カルテ • /)0σʔλʢ࣮σʔλʣͱઌߦݚڀɺμϛʔϨίʔυͷ౷ܭྔΛൺֱ ઌߦݚڀ n (4,%<"SBNBLJ > /5$*3.FE/-1%PD<"SBNBLJ > → 症例数は少ないが、質的には実データに近い - 退院サマリー 9 ダミーレコード作成: 統計量

Slide 10

Slide 10 text

- 退院サマリーの記載事項 - ⼊院⽇数⽂の⼊院カルテは全て連結して⼀つの⽂書として扱う - 本研究におけるすべてのアノテーションは医師の監修のもと⾏った 10 本研究における前処理︓⽣成対象 退院サマリー作成に関するガイダンス. 退院時要約等の診療記録に関する標準化推進合同委員会. 2019 ߏ଄Խ͞Ε͍ͯͳ͍ ҩࢣ͕࡞੒͢Δ ࣗ༝هࡌՕॴ →本研究の⽣成対象 (⼊院前記述 ) (⼊院後記述 )

Slide 11

Slide 11 text

1. 評価⽤ダミーレコード作成(Chapter 3) 2. Clinical segmentの開発(Chapter 4) 3. Clinical role labelの開発(Chapter 5) 4. 抽出的要約に最適な⼊⼒粒度の探索(Chapter 6) 5. 抽象的要約にメタ情報は有⽤なのか(Chapter 7) 6. ソースが⼊院カルテのみで退院サマリー⽣成は可能なのか(Chapter 8) 11 ⽬次

Slide 12

Slide 12 text

- ⽂、節などの⾔語的単位 ˠ 医療的意味を捉えられないのでは︖ 12 Clinical segment ⽂ ೝ஌঱͕ਐΜͰ͓Γ࿈༻અࣗ୐ୀӃ͸ओ୊ϋࠔ೉Ͱ͋Δ࿈ମઅܗ໊ࣜࢺ͜ͱମݴࢭ ࢪઃೖډͷͨΊʹ͸ओ୊ϋ͝Ո଒ͷखଓ͖͕ඞཁʹͳΔ͜ͱΛิ଍અઆ໌ ೝ஌঱͕ਐΜͰ͓Γࣗ୐ୀӃ͸ࠔ೉Ͱ͋Δ͜ͱɺࢪઃೖډͷͨΊʹ͸͝Ո଒ͷखଓ͖͕ඞཁ ʹͳΔ͜ͱΛઆ໌ 節(CBAP [Maruyama+, 2004]より付与) Clinical segment 認知症が進んでおり⾃宅退院は困難であること、施設⼊居のためにはご家族 の⼿続きが必要になることを説明

Slide 13

Slide 13 text

13 Clinical segmentの定義 動詞&読点&サ変名詞で分割 かっこで分割 病名が含まれていれば その節は分割 検査結果とその結果は分割 医療的事象が含まれて いなければ分割しない 分割しても意味が 増加しなければ分割しない 例 外 基本ルール

Slide 14

Slide 14 text

- 著者1名と医療従事者2名によりダミーレコードにアノテーション • "HSFFNFOUSBUF  • 5PUBMOVNCFSPGTFHNFOUT  - 粒度 14 アノテーション結果 ⽂ > Segment > 節

Slide 15

Slide 15 text

- Full-stop • ۟఺ - Full-stop & verb • ۟఺ɺಈࢺʴαม໊ࢺ - CBAP • <.BSVZBNB >Ͱ࡞੒͞ΕͨͷϧʔϧΛ΋ͱʹઅΛ෼ׂ͢ΔTQMJUUFS - SEGBOT • <-J >Ͱ&%6Λ෼ׂ͢ΔͨΊʹఏҊ͞Εͨ//Ϟσϧ 15 ⾃動分割︓モデル

Slide 16

Slide 16 text

- 分割精度(six-fold cross-validation) • ػցֶशϕʔεͷ΋ͷ͕࠷ྑɻ$#"1͸௿͍ͷͰઅͱ͸ҟͳΔɻ 16 ⾃動分割︓結果

Slide 17

Slide 17 text

1. 評価⽤ダミーレコード作成(Chapter 3) 2. Clinical segmentの開発(Chapter 4) 3. Clinical role labelの開発(Chapter 5) 4. 抽出的要約に最適な⼊⼒粒度の探索(Chapter 6) 5. 抽象的要約にメタ情報は有⽤なのか(Chapter 7) 6. ソースが⼊院カルテのみで退院サマリー⽣成は可能なのか(Chapter 8) 17 ⽬次

Slide 18

Slide 18 text

- 後の要約実験の解析のために、NHOデータ中の表現を深く調べたい (=何が書かれているのか知りたい) - しかし、⼿作業ですべてをチェックすることは、コストなどの観点から⾮現実的 → ⾃動的に付与できる医療的な役割ラベルを開発したい • 関連研究 n UMLS [Bodenreider, 2004]などの医学⽤語オントロジー →Entityのみを対象 ⽂脈付き表現に医療的役割を付与するClinical role labelを開発 18 Clinical role label︓概要

Slide 19

Slide 19 text

- 退院サマリーには医師による様々な情報処理の結果が表現されている • ྫɿೖӃॳظɺ਎ମݕࠪ΍ݕମݕࠪΛߦ͏ ˣ ˠࣄ࣮ͱͯ͠ೖӃױऀͷ਍ྍจॻʹه࿥ ݕࠪ݁ՌͷධՁɺ਍அɺ࣏ྍํ਑ͳͲΛࣄ࣮ʹج͍ͮͯߦ͏ ˠҩࢣͷղऍͱͯ͠ೖӃױऀͷ਍ྍจॻʹه࿥ → 退院サマリーの記述に主観性は深く関わる 客観的、主観的な情報を分類できるような定義を作成 19 Clinical role label︓Motivation

Slide 20

Slide 20 text

- アノテーションのための定義 20 Clinical role label︓定義 患者の状況 患者の⾏動 ⽇時、括弧 などの表現 画像所⾒などの 客観的でもあり 主観的でもある表現 時制情報が 落ちた表現 事実に基づく評価 診断 治療計画 仮定表現、条件⽂など 推量表現(マルチラベル) 主観性低 主観性⾼ 主観性中 ↑(アノテーション品質管理のためのクラス あとの分析には⽤いない)

Slide 21

Slide 21 text

- ダミーレコードのclinical segmentsに対してアノテーション • ໊̎ͷҩྍैࣄऀ • "HSFFNFOUSBUF 21 Clinical role label︓アノテーション

Slide 22

Slide 22 text

- モデル • 65)#&35 <,BXB[PF >ɿ౦େපӃͷ਍ྍ࿥NJMMJPOจΛࣄલֶशͨ͠#&35 • ϥϕϧΛλεΫʹ෼͚ͯ.VMUJUBTLUSBJOJOH n 4VCKFDUJWJUZ High/Middle/Low n 3PMFΫϥε n 1SPCBCMF5' • ̏ͭͷ෼ྨثΛಘΔ 22 Clinical role label︓⾃動分類

Slide 23

Slide 23 text

- 結果 (train:3216, val:300, test:300) - )JHIͱ-PX͸ߴ͍ɻ.JEEMF͸௿͍ˠᐆດͳϥϕϧΛؚΉͨΊ - 0UIFSTͱ/POGBDU͕௿͍ˠ਺͕গͳ͍ʢͦΕͧΕσʔληοτશମͰ ʣ 23 Clinical role label︓⾃動分類の結果

Slide 24

Slide 24 text

- 結果 (train:3216, val:300, test:300) - શମతʹ෼෍͸ࣅ͍ͯΔˠμϛʔϨίʔυͷҰൠੑΛࣔ͢ - %FTDSJQUJPOɺ"DUJPO͕ଟ͍ʢˠ਍ྍաఔΛه࿥͢Δͱ͍͏਍ྍ࿥ͷ໨త͔Β͢Ε͹ଥ౰ʣ - &WBMVBUJPO %JBH 1MBO͕΄΅ಉྔʢˠॴݟ΍ݕࠪ݁Ռʹର͢ΔධՁɺྟচ਍அɺ࣏ྍܭը͕ಉఔ౓Ͱߏ੒͞Ε ͍ͯΔʣ - 0UIFST͕/)0σʔλͰଟ͍ˠΑΓϊΠδʔͳσʔλ - ҩྍจॻͷ඼࣭ΛఆྔԽ͠ɺςΩετʹදݱ͞ΕͨΑΓৄࡉͳҩྍ஌ࣝΛऔಘͰ͖ΔՄೳੑ͕͋Δ 24 Clinical role label︓NHOデータ中のラベル分布

Slide 25

Slide 25 text

1. 評価⽤ダミーレコード作成(Chapter 3) 2. Clinical segmentの開発(Chapter 4) 3. Clinical role labelの開発(Chapter 5) 4. 抽出的要約に最適な⼊⼒粒度の探索(Chapter 6) 5. 抽象的要約にメタ情報は有⽤なのか(Chapter 7) 6. ソースが⼊院カルテのみで退院サマリー⽣成は可能なのか(Chapter 8) 25 ⽬次

Slide 26

Slide 26 text

- 抽出要約の⼊⼒にclauseなどの⽂以外の粒度を⽤いる研究が⾏われている[zhou+, 2020] [cho+, 2020] ˠҩྍจॻʹ͸ҩֶతίϯηϓτΛߟྀͨ͠୯Ґͷํ͕ྑ͍ͷͰ͸ʁ 26 最適な粒度の探索︓Introduction ⽂、節、clinical segmentを⼊⼒にした抽出要約の実験

Slide 27

Slide 27 text

27 最適な粒度の探索︓モデル

Slide 28

Slide 28 text

- 訓練のためにソースのユニットに対してGoldラベルを付与する必要がある(抽出要約は分類 タスクであるため) ˠٖࣅతͳਖ਼ղϥϕϧΛ࡞੒ • ઌߦݚڀͰΑ͘༻͍ΒΕΔख๏Λ࠾༻  ֤TFHNFOUʹରͯ͠UBSHFUαϚϦʔؒͰ3PVHF'είΞΛٻΊΔ  ߹ܭ͕ จࣈΛ௒͑Δ·Ͱ3PVHFείΞ͕ߴ͍TFHNFOUΛ্͔ΒूΊΔ (=Oracle)(  /)0σʔλͷୀӃαϚϦʔͷฏۉ௕) 28 最適な粒度の探索︓訓練データ .PEFMl"NFSJDBOTBSFFYQPTFEUPUIF$07*%z 3FGl"NFSJDBOTXFSFFYQPTFEUPUIF&CPMBWJSVTz ˣ .PEFM<  "NFSJDBOT  "NFSJDBOTBSF  BSFFYQPTFE  FYQPTFEUP  UPUIF UIF$07*% > 3FG<  "NFSJDBOT  "NFSJDBOTXFSF  XFSFFYQPTFE  FYQPTFEUP  UPUIF UIF&CPMB  &CPMB WJSVT > ˣ 3FDBMM 1SFDJTJPO ˣ '

Slide 29

Slide 29 text

- 5SBJO  7BM  5FTU  - $MJOJDBMTFHNFOU͕࠷΋Α͔ͬͨ - 4FOUFODF$MBVTF೔ຊޠʹ͓͚Δઅ͸ӳޠͷ΋ͷΑΓ΋୹͍୯ҐͰ͋ΓɺͦΕ͕Өڹ ͍ͯ͠Δ - ҩྍ෼໺ͷࣗಈཁ໿ʹ͸ߏจ৘ใ͚ͩͰͳ͘ɺυϝΠϯ஌ࣝʹؔ࿈ͨ͠ߴ౓ͳ৘ใ͕ඞ ཁͰ͋Δ͜ͱ͕ࣔࠦ͞ΕΔ 29 最適な粒度の探索︓結果

Slide 30

Slide 30 text

1. 評価⽤ダミーレコード作成(Chapter 3) 2. Clinical segmentの開発(Chapter 4) 3. Clinical role labelの開発(Chapter 5) 4. 抽出的要約に最適な⼊⼒粒度の探索(Chapter 6) 5. 抽象的要約にメタ情報は有⽤なのか(Chapter 7) 6. ソースが⼊院カルテのみで退院サマリー⽣成は可能なのか(Chapter 8) 30 ⽬次

Slide 31

Slide 31 text

- いままで、どのようなメタ情報 (病院、疾患など)が⾃動要約の精度をあげるのかに ついて確認されていない ˠҩྍσʔλ͸ଞυϝΠϯΑΓ΋σʔληοτ಺ɺ֎ͷόΠΞε͕ݦஶ<7BSPRVBVY > ʢපӃɺҩࢣ͝ͱʹΧϧςͷॻ͖ํ͕ҧ͏ɺॏ౓ͷ࣬ױ͸αϚϦ͕ංେԽʣ ˠϝλ৘ใ͕༗ޮͳͷͰ͸ʁ - ϝλ৘ใͷ༗༻ੑΛࣔ͢ͱɻɻɻ ˠσʔλ੔උஈ֊Ͱଟ༷ͳϝλ৘ใΛऔू͢Δॏཁੑ ˠଟػؔɺଟ࣬ױͳͲΛؚΜͩςετͷॏཁੑʢଟ͘ͷݚڀ͸ػؔʣ 31 抽象的要約にメタ情報は有⽤なのか︓Motivation 疾患︓急性喉頭蓋炎 診療科︓救急科 ⼊院⽇数︓6⽇ 疾患︓慢性⼼不全, ⾼⾎圧症, 慢性腎臓病, 認知症 診療科︓内科 ⼊院⽇数︓19⽇

Slide 32

Slide 32 text

- <%JBT > - ୀӃαϚϦʔੜ੒ʹϝλ৘ใΛಋೖ͍ͯ͠Δ΋ͷͷɺͦͷӨڹ͸෼ੳ͞Ε͍ͯͳ͍ 32 関連研究 患者の診療録をtf-idfでグルーピングしてエンコード 書いた医療従事者情報をエンコード(医師、放射線技師、看護師..)

Slide 33

Slide 33 text

- ⽤いるメタ情報 • 44.*9ن֨ʹΑͬͯج൫ͱͳΔ9.-ߏ଄͕ఆΊΒΕ͍ͯΔ෦෼ͱɺϕϯμʔʹΑͬͯҟ ͳΔ෦෼ʢࣗ༝هड़ཝʣ͕ଘࡏ͢Δ  ࣬ױ • ࣗ༝هड़ཝ͔Βऔಘͨ͠ओ࣬ױ • *$%ίʔυ͕ͳ͍΋ͷ͸.F$BC +.F%JDΑΓ*$%ίʔυऔಘ • *$%ίʔυͷ಄จࣈܻ̏ΛΤϯίʔυʢºº࣍ݩʣ ೔਺ • 9.-͔Βऔಘͨ͠ೖӃ೔਺ • ࠷େ ೔  ࣍ݩ ͰΤϯίʔυ ҩࢣ • 9.-͔Βऔಘͨ͠୲౰ҩ৘ใ • ਓͣͭάϧʔϐϯά࣍͠ݩʹΤϯίʔυ පӃ • 9.-͔Βऔಘͨ͠පӃͷ৘ใ 33 メタ情報の扱い⽅

Slide 34

Slide 34 text

- #&35΍9-.ʹͳΒ͍ɺ&NCFEEJOH૚Λ௥Ճͯ͠ɺ֎෦৘ใΛऔΓࠐΉ - ೖྗɺग़ྗ͕ڞʹ௕͍υΩϡϝϯτͳͨΊɺ௕͍γʔέϯεΛѻ͍͍ͨ ˠܭࢉޮ཰ͷྑ͍-POHGPSNFSΛ࠾༻ 34 モデル

Slide 35

Slide 35 text

- 5SBJO  7BM  5FTU  - %JTFBTF͕࠷΋Α͔ͬͨ *$%Φϯτϩδʔ͕ɺྨࣅͨ͠දݱΛ࣋ͭάϧʔϓΛޮ཰తʹΫϥελϦϯά͍ͯ͠Δ - #4 #3Ͱϝλ৘ใΛ༻͍ͨϞσϧ͕WBOJMMBΛ্ճͬͨ ˠϝλ৘ใΛ༻͍ͨํ͕ਓؒʹͱͬͯࣗવͳग़ྗ 35 結果 #FSU4DPSF #-&635 χϡʔϥϧϕʔεͷධՁࢦඪ ҙຯͷۙ͞ͳͲΛߴਫ਼౓ʹଊ͑ΒΕΔ "MM͸֤GFBUVSFΛશͯ&NCFEEJOH૚ʹ ௥Ճͨ͠΋ͷʢ 'FBUVSFFNCFEEJOHTʣ

Slide 36

Slide 36 text

- ⽣成された単語がGoldサマリーに含まれているか(=適切な単語を出⼒できているか) • .F$BCͰϥϕϦϯά - ࣬ױ৘ใΛΤϯίʔυ͢Δͱద੾ͳ࣬ױɾ঱ঢ়Λग़ྗͰ͖Δ - 1IZTJDJBO΍)PTQJUBMΛΤϯίʔυ͢Δͱه߸ͷੜ੒ਫ਼౓͕޲্͢Δ ˠපӃ΍ҩࢣʹΑͬͯهड़ͷบʢʮɾʯʮ ʯʮʯͳͲͷՕ৚ॻ͖ɺʮɼʯʮɺʯʮɽʯͳͲͷ۟ಡ఺ʣ͕ҟͳΓɺͦΕ ΒΛ͏·ֶ͘शͰ͖Δ 36 単語の出⼒精度

Slide 37

Slide 37 text

1. 評価⽤ダミーレコード作成(Chapter 3) 2. Clinical segmentの開発(Chapter 4) 3. Clinical role labelの開発(Chapter 5) 4. 抽出的要約に最適な⼊⼒粒度の探索(Chapter 6) 5. 抽象的要約にメタ情報は有⽤なのか(Chapter 7) 6. ソースが⼊院カルテのみで退院サマリー⽣成は可能なのか(Chapter 8) 37 ⽬次

Slide 38

Slide 38 text

- 問題 ୀӃαϚϦʔ͸ෳ਺৘ใݯͷू߹ ৘ใ͕ιʔεʹͳ͍Մೳੑ͕͋Δ ιʔεʹͳ͍৘ใ͸ੜ੒Ͱ͖ͳ͍ Ϟσϧͷ)BMMVDJOBUJPOΛՃ଎ͤ͞Δ ʢྫʣ੨ࣈ͸Χϧςʹଘࡏ͠ͳ͍৘ใ ਫ਼౓͕ॏཁͳҩྍจॻʹ͓͍ͯ͸ॏཁͳ໰୊ ʢ΋͠ೖӃΧϧςͷΈͰे෼ʹੜ੒Ͱ͖ͳ͍ͳΒ͹ෆྑઃఆ໰୊ʣ - どのような⽂書があれば退院サマリーを再現できるのか調べる 38 ⼊院カルテのみで退院サマリーは⽣成できるか 全⾝ステロイド(mPSL40mgIV→PSL40mg 計5⽇間)と気管⽀拡張薬吸⼊による標準的な治療を ⾏った。 喘息の割に酸素化不良でSat>90%を維持するのに酸素投与を数⽇間必要としたために、胸部CTと ⼼エコーによる追加検査を⾏ったが、胸部CTでは気管⽀炎と早期の気管⽀肺炎を疑わせる像を認 め、⼼エコーでは特記すべき異常はみられなかった。 前者に対してアジスロマイシン500mgx3⽇間を追加し、ほぼ1週間の⼊院の経過で呼吸状態は次 第に改善し、退院となった。 ⼊院中に測定したIgEとRASTでは⾼値を認め、アレルギー体質が確認された。 退院に際してはICS+LABA(シムビコート1回2吸⼊ 1⽇2回)を処⽅した。 ●クリニックに主に受診していたことから今後の外来フォローはそちらにお願いした。

Slide 39

Slide 39 text

- ཁ໿࣌ʹσʔληοτ಺Ͱ࠶ݱͰ͖ͳ͍໰୊ʹର͢Δઌߦݚڀ[Xu+, 2021][Maynez+, 2020] • Goldɺੜ੒αϚϦʔʹHallucination͕ଘࡏ͢Δ͕ɺͦͷҰ෦͸σʔληοτʹ৘ใʢ͜͜ Ͱ͸ଞχϡʔεهࣄʣ͕͚͍ܽͯΔ͜ͱʹىҼ → この研究は臨床⽂書要約の同種の問題についてのパイロットスタディ 39 要約時に再現できない問題の先⾏研究

Slide 40

Slide 40 text

- アノテーション対象 • /)0σʔλ͔ΒϥϯμϜநग़͞Εͨ঱ྫɺTFHNFOUT - 退院サマリーの表現が⼊院カルテから再現できるか︖ • 5' - どの⽂書に由来していると思われるか︖(14種) • 1BUJFOUSFGFSSBMEPDVNFOUTʢ਍ྍ৘ใఏڙॻʣ • 0VUQBUJFOUDMJOJDBMSFDPSETʢ֎དྷΧϧςʣ • &NFSHFODZSPPNSFDPSETʢٹٸ֎དྷͷه࿥ʣ • 1BUJFOU`TQBTUDMJOJDBMSFDPSETʢױऀຊਓͷաڈͷ਍ྍ࿥ <਍ྍ৘ใఏڙॻɺ֎དྷΧϧςɺٹٸ֎དྷҎ֎> ʣ • 1SFTDSJQUJPOTʢॲํᝦʣ • /VSTJOHSFDPSETʢ؃ޢه࿥ʣ • &YBNJOBUJPOSFTVMUTʢݕࠪ݁Ռʣ • &$(SFQPSUTʢ৺ిਤϨϙʔτʣ • 3FIBCJMJUBUJPOSFQPSUTʢϦϋϏϦϨϙʔτʣ • 4VSHJDBMPQFSBUJPOOPUFTʢखज़Ϩϙʔτʣ • "OFTUIFTJBSFDPSETʢຑਲه࿥ʣ • 0UIFSQBUJFOUT`DMJOJDBMSFDPSETʢଞਓͷΧϧςهࡌʣ • 0UIFSEPDVNFOUTʢ্هҎ֎ͷจॻʣ • *OGPSNBUJPOOPUEFSJWFEGSPNBOZEPDVNFOUTʢจॻʹ༝དྷ͠ͳ͍৘ใ <೴಺هԱͳͲ>ʣ 40 アノテーション 過去の記録 現在の記録 → 医師含む医療従事者2名でアノテーション

Slide 41

Slide 41 text

- サマリー全体で61.3%の情報が⼊院カルテ由来(38.7%は由来していない) - ٬؍తهड़ʢݕࠪ݁Ռ΍೔ࠒͷ؍࡯ͳͲʣ͸ೖӃΧϧςʹهࡌ͞Ε΍͍͢ɺओ؍తهड़ʢධՁɺ ਍அɺܭըͳͲʣ͸هࡌ͞Εʹ͍͘ - ⼊院カルテに由来していないセグメントが含まれる⽂書は87% 㱺χϡʔεཁ໿ͷσʔληοτ͕<.BZOF[ >ͱࢦఠ͞Ε͍ͯΔͷͰɺΑΓෳ਺จॻ͕ ඞཁͳλεΫ 41 ⼊院カルテから再現できるかの結果

Slide 42

Slide 42 text

- ⼊院前、⼊院後 • ೖӃલهड़͸ೖӃΧϧςʹهࡌ͞Εʹ͍͘ ʢױऀͷܦྺηΫγϣϯ͸਍ྍ৘ใఏڙॻ΍֎དྷΧϧςͳͲͷաڈͷ਍ྍ࿥͕ࢀর͞ΕΔ͜ͱ͕͋Δʣ 㱺/)0͸த֩පӃͰ͋ΔͨΊɺ৽نױऀ͸঺հঢ়ܦ༝Ͱɺͦͷଞ͸ࣗපӃड਍ྺ͕͋Δ͜ͱ͕ଟ͍ɻ - 病院別の結果 • පӃʹΑΓ͔ͳΓੑ࣭͕ҟͳΔʢଟػؔͰͷௐࠪͷॏཁੑΛࣔ͢ʣ 42 ⼊院カルテから再現できるかの結果

Slide 43

Slide 43 text

- 2番⽬に多いソースは過去の診療録 - 3番⽬に多いソースは診療情報提供書 ˠ্هͭͰܽམ͍ͯ͠Δ৘ใͷ͕ิ׬Ͱ͖Δ - 4番⽬に多いのは⽂書に由来しないソース ˠҩࢣͷهԱ΍ઐ໳஌ࣝɺৗࣝͳͲจॻҎ֎ͷ৘ใ ͕ॏཁͰ͋Δ͜ͱΛࣔࠦ • ಛʹɺೖӃޙهड़Ͱ͸֎෦ιʔεத൪ ʢԿ΋ҟৗ͕ͳ͔ͬͨlஶมͳ͠z΍ୀӃޙͷܭըͳͲʣ 退院サマリーの⽣成には様々な種類の⽂書が必要 43 どの⽂書に由来しているか︖

Slide 44

Slide 44 text

- ⾔語および⽂化的な依存性 • ೔ຊޠͷจ๏΍೔ຊͷҩྍश׳͸Ԥभͱ͸େ͖͘ҟͳΓɺهड़ɺཁ໿ɺධՁͷϓϩηεʹҧ͍͕ ͋ΔՄೳੑ͕͋Δɻ • ಛʹɺDMJOJDBMTFHNFOU DMJOJDBMSPMFMBCFM͸೔ຊޠͰఆٛ͞Εɺૉ௚ʹଞݴޠʹద༻͢Δ͜ͱ͸ Ͱ͖ͳ͍ɻ • ͔͠͠ɺ͜ͷίϯηϓτ͸ଞͷݴޠʹ΋༗༻Ͱ͋ΔͱࢥΘΕΔɻ • ଞࠃͰ͸ɺྟচه࿥ͱͦͷཁ໿ʹޱड़චه͕޿͘࢖༻͞Ε͍ͯΔ ͷ঱ྫ JO64 <$BOOPO > ˠ೔ຊ͸৘ใݯ͔ΒαϚϦʔ΁ͷίϐʔϖʔετ͕සൟʹߦΘΕΔՄೳੑ͕͋Δ ࠓճ ͷσʔλͰ͸ - アノテーション対象⽂書の代表性 • ҩྍैࣄऀʹΑΔΞϊςʔγϣϯΛߦͳͬͨͨΊɺίετͷؔ܎ͰαϯϓϦϯάจॻ͕খن໛ - ⼊院カルテ以外の⽂書の拡充 • ࠓճ͸ೖӃΧϧςͷΈΛର৅ʹ͕࣮ͨ͠ࡍʹଟछྨͷจॻΛूΊ࣮ͨূతͳ෼ੳ͕ߟ͑ΒΕΔ • ϝλ৘ใ΋ױऀͷੑผɺ೥ྸɺਓछɺफڭɺ࢖༻͢Δ&)3γεςϜͳͲ༷ʑߟ͑ΒΕΔ ˠ͞ΒͳΔݚڀج൫ͷ੔උ͕ඞཁ - ⼈⼿評価 • ҩࢣͷ͞ΒͳΔڠྗ͕ඞཁͰ͋ΓɺߴίετͳͨΊஅ೦ 44 本論⽂のLimitation

Slide 45

Slide 45 text

- Clinical segmentは実際にどのくらい医療的意味を捉えられているのかを調査 ˠཁ໿λεΫΛ௨ͨ͠ධՁ͔͠ߦ͍ͬͯͳ͍ͨΊ - Clinical role labelが多様な医療⽂書の定量評価に使えるか評価 - ⼤規模なダミーカルテ - 将来的には画像診断などの医療AIタスクと同じように、医師との共同作業が考えられる (AIによる初稿→医師が編集) • ਓؒͱ"*ͷ࠷దͳ૬ޓ࡞༻Λཱ֬͢ΔͨΊͷݚڀ͕ඞཁͰ͋Δ n 医師がAI予測結果に対して信⽤する条件 [NHS AI Lab & Health Education England, 2022] n 医師と協調したインターフェイス開発の重要性&既存の電⼦カルテシステムと統合する困難さ [Lu+, 2022] 45 Future work

Slide 46

Slide 46 text

モデルへの信頼性向上 - モデルの精度⾯ • 1SFDJTJPOͷߴ͍ग़ྗ • จॻԽ͞Ε͍ͯͳ͍஌ࣝͷ࠶ݱ໰୊͸ڊେࣄલֶशϞσϧͰղܾͰ͖ΔՄೳੑ͕͋ Δ ˠ(BUPS5SPO .FE1B-. - 精度以外の⾯ • Ξ΢τϓοτͷදݱݩͱͳͬͨҩྍจॻΛදࣔ͢Δɺͭ·Γੜ੒ͷΤϏσϯεΛද ࣔ͢Δ • ੜ੒͞ΕͨςΩετͷ৴པ౓Λࣔ͢ • ҩࢣͷ޷ΈΛߟྀͨ͠ύʔιφϥΠθʔγϣϯ 46 Future work

Slide 47

Slide 47 text

- Is In-hospital Meta-information Useful for Abstractive Discharge Summary Generation? ,FOJDIJSP"OEP .BNPSV,PNBDIJ 5BLBTIJ0LVNVSB )JSPNBTB)PSJHVDIJ :VKJ.BUTVNPUP 5IFUI*OUFSOBUJPOBM$POGFSFODFPO5FDIOPMPHJFTBOE"QQMJDBUJPOTPG"SUJGJDJBM*OUFMMJHFODF 5""* - Exploring the Optimal Granularity for Extractive Summarization of Unstructured Health Records: Analysis of the Largest Multi-Institutional Archive of Health Records in Japan ,FOJDIJSP"OEP 5BLBTIJ0LVNVSB .BNPSV,PNBDIJ )JSPNBTB)PSJHVDIJ :VKJ.BUTVNPUP 1-04%JHJUBM)FBMUI  - Is Artificial Intelligence Capable of Generating Hospital Discharge Summaries from Inpatient Records? ,FOJDIJSP"OEP 5BLBTIJ0LVNVSB .BNPSV,PNBDIJ )JSPNBTB)PSJHVDIJ :VKJ.BUTVNPUP 1-04%JHJUBM)FBMUI  47 博⼠論⽂を構成する論⽂

Slide 48

Slide 48 text

おわり