人工知能を用いた心血管疾患の臨床研究のための実践的入門書

4fe5193960c3289769e3913281560dc4?s=47 Nakashima Takaya
September 04, 2020

 人工知能を用いた心血管疾患の臨床研究のための実践的入門書

4fe5193960c3289769e3913281560dc4?s=128

Nakashima Takaya

September 04, 2020
Tweet

Transcript

  1. 1

  2. 著者 Nobuyuki Kagiyama, MD, PhD; Sirish Shrestha, MS; Peter D.

    Farjo, MD; Partho P. Sengupta, MD, DM 2
  3. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 3
  4. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 4
  5. 5 個人情報のため非公開です。 自己紹介

  6. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 6
  7. AIは、医療や循環器医療の分野に浸透し、改革が始まっている。 しかし、多くのデータがいまだに使われていない、、 (ex 電子カルテ,モバイルヘルスデバイス,マルチモダルティ画像) 7

  8. 循環器内科 心臓の鼓動ごとに多くの情報を入手できる 臨床現場へのAIの導入が活用できる1分野になる 患者さんに割ける時間も増え、より円滑な医療ができる 現場の医師がAI技術を理解することが大事!! 8

  9. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 9
  10. ③AIの基礎知識 AIとは? 10

  11. 専門的・専用的な目的に特化した応用 AI(特定 AI)が現在の AI である (弱いAI) システムが自給自足で、人間に匹敵する認知能力を持つ 汎用AI(General AI)はまだ存在しない (強いAI)

    強いAIと弱いAIとは https://ledge.ai/strong-ai/ 11
  12. 12

  13. 教師あり学習は『与えられたデータを元にそのデータがどんなパターンになるか識別、予測するもの』 教師なし学習は『特徴を表すデータを入力し、それをグループに分けて入力データの構造を理解する』 強化学習は『報酬を最大化するように行動して学習していく』(あまり使われない) 13

  14. AIが急激に盛り上がりを見せている理由 ビックデータの出現(インターネットの普及) 演算能力の進化(GPU) ディープラーニング技術の開発 ・AI研究のためのリソースを一般臨床医や研究者が手軽に使えるようになった 14

  15. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 15
  16. AI(機械学習)と統計学の違い 統計はデータの“説明”に重点を置く 機械学習はデータの“予測”に重点を置く 16 Machine Learning vs. Statistics https://www.svds.com/machine-learning-vs-statistics/

  17. 17

  18. ロジスティック回帰モデル、線形回帰モデルは 統計学でも機械学習でも用いられる 線形回帰モデルにおいて 統計学:重要なのは 係数(重み)とバイアス 機械学習:重要なのは 未知のデータの予測 18

  19. AIは因果推論を提供しない!? 病気の原因までを探るAI研究は発展途上 AI解析の結果を裏付けるには、病態生理や疾患メカニズムに関する 既存の知識を慎重に検証しなければならない(説明可能性の問題) 19 AIで原因と結果を把握する ~機械学習と因果推論の融合 Meta-Learner~ https://note.com/tak1/n/nc28b93a07452

  20. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 20
  21. 21

  22. 22

  23. アンサンブル学習 決定木やロジスティック回帰などの「弱い」複数のアルゴリズムを組み合わせて 良好な予測を得る機械学習手法 パギング…全体から一部のデータを用いて複数のモデルを使って学習する方法 (複数のモデルを一気に並列に作成する) 各アルゴリズムの結果を組み合わせて分散の小さい出力にする ブースティング…一部のデータを繰り返し抽出し複数のモデルをを学習させる方法 (逐次的に作成する) 先行するアルゴリズムの誤差を考慮してバイアスを低減して学習する スタッキング…あるアルゴリズムの結果を別のアルゴリズムの入力として使う方法。

    (モデルを積み重ねる(Stackする)ことで精度を高める) 23
  24. スタッキング 動物:ベースモデル 先生:メタモデル 「ベースモデルの出力」を入力として学習し、結果を出力する アンサンブル⼿法のStackingを実装と図で理解するhttps://blog.ikedaosushi.com/entry/2018/10/21/204842?t=0 24

  25. ディープラーニング 25

  26. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 26
  27. ⑥循環器データへの応⽤ 構造化データと非構造化データの違い ・構造化データ…ExcelやCSVファイルなどで表現される、列と行の概念を持つデータ。 どこにどんなデータがあるのか、列と行によって決められているので、 データの検索、集計、比較などの分析タスクに適している。 ・非構造化データ…構造定義されておらず、関係モデルに適合されていないデータ。 量が多く、発生頻度が高く、発生場所や種類も多いという、3つの特徴がある 医療データ:EHR内のテキスト情報、医療画像、音声・映像画像 27

  28. 28

  29. 1. Data Structure 構造化データ 2. Year 2016 3. First author

    Motowani氏 4. Task 分類・予後予測(教師あり学習) 5. Model アンサンブル学習 6. Summary CONFIRM(Coronary CT Angiography Evaluation for Clinical Outcome)試験に登録された 冠動脈疾患患者10030人の大規模集団における5年死亡率を予測するために、構造化データ上の機械 学習アルゴリズムの予測能力を調査した。彼らはデータセットの69のパラメータを解析するためにアン サンブル学習を使用した。 機械学習アルゴリズム(AUC=0.79)の方が他の従来のリスクスコア(AUC=0.61~0.64)よりも有意に 良好であることがわかった。 29
  30. 1. Data Structure 構造化データ 2. Year 2019 3. First author

    Casaclang-Verzosa 氏 4. Task クラスタリング&次元削減(教師なし学習) 5. Model トポロジカルデータ解析 6. Summary 大動脈弁狭窄症の進行における左室反応パターンの表現型を理解するために トポロジカルデータ解析を適用した。 トポロジカルデータ解析により、4つのパラメータから作成された患者-患者類似度ネットワークを可視化す ることができた。ネットワーク内の患者の相対的な位置は、疾患の表現型や予後と関連していた ❓❓ 30 トポロジカルデータ解析
  31. 31

  32. 32 トポロジカルデータ解析(TDA)とは? トポロジー:対象の大まかな形を理解する(雰囲気の形を捉える) ドーナツ=コーヒーカップ(∵穴の数が同じ) トポロジカルデータ解析:データの形を見るためのアルゴリズム データの形とは? このデータを『まる』として解析したい!!

  33. 33 Idea: Persistent Homology Persistent Homology: データの点を“太らせる” b-dで穴の“大きさ”が分かる

  34. 34 小さい半径でbirthして 大きくなるまでdeathしなかった 大きな『まる』のデータがあった 生まれてすぐdeathした 『ノイズ』の可能性あり どうやら⼤きい輪が⼀つあるような形をしている!! https://www.slideshare.net/YutakaKuroki/lytics-112543204

  35. 35

  36. 機械学習が統計学よりも優れているとは限らない!? 36

  37. • 65歳以上で入院した患者56,477人を対象に研究を行った データセットには約100の候補変数が含まれており、アンサンブル学習を含む いくつかの機械学習手法の中から、30日間の再入院率を予測するための性能を比較した • 大規模なデータセットにもかかわらず、ロジスティック回帰モデルは他の複雑な機械学習 モデルよりも優れた性能を達成した しかし、このロジスティックモデルの性能も控えめ(AUC=0.624)であり、 結果に寄与する測定されていない/知られていない重要な変数が多く存在することを示唆 37

  38. 1. Data Structure 心エコー 2. Year 2018 3. First author

    Zhang 4. Task 分類、心エコーの自動解釈 5. Model CNN 6. Summary 14035枚の心エコーを用いて、CNNはビューの自動分類、 画像のセグメンテーション、心臓体積の測定、疾患と健常者との鑑別を可能にした GPU を使⽤した Caption Health の⼼エコー図 https://blogs.nvidia.co.jp/2020/08/21/ai-echocardiogram-covid/ 38 非構造化データ
  39. 1. Data Structure 心電図 2. Year 2019 3. First author

    Hannun 4. Task 分類(不整脈の検出) 5. Model CNN 6. Summary 91232個の単一リード心電図を用いて、単一リードの心電図を洞調律、接合リズム、心房室ブロック、 心房細動などの12のクラスのリズムに分類するディープラーニングアルゴリズムを開発した。 訓練されたアルゴリズムは、12種類の心拍数の予測が循環器内科医よりも優れていた(F値0.84 vs 0.78) https://speakerdeck.com/takay88 単一リード心電図 39
  40. 1. Data Structure 心音図 2. Year 2016 3. First author

    Potes 4. Task 分類(心音が正常か異常か) 5. Model Adaboost&CNN (Adaboostはランダムよりも少し精度がいい弱い識別機を組みわせ強い識別機を作成しようとする機械学習モデル 6. Summary AdaBoostとCNNの組み合わせは、PhysioNet/CinCのデータセットで正常と異常な心音を識別するための 感度94.2%、特異性77.8%を示した。 心房細動を99%検出するAIと電子聴診器 https://japanese.engadget.com/jp-2020-02-04-ai-99.html 40
  41. 1. Data Structure EHR (電子健康記録:Electronic Health Recordは、全国の医療機関の診療データを集積し、診療データを患者 に開示、さらに複数の医療機関が連携して診療するもの) 1. Year

    2019 2. First author Mallya 3. Task 分類(予後予測) 4. Model LSTM (LSTMは、RNNの拡張として1995年に登場した、時系列データに対するモデル) 5. Summary 心不全患者21405人と対照者194989人を用いたケースコントロール研究を実施した 彼らは12ヶ月間の期間に単一の患者ごとに1840個のパラメータを抽出し、LSTMで解析することで発症 15ヶ月前に心不全の発症を予測(AUC=0.91)した。 41
  42. 1. Data Structure EHR内のテキストデータ 2. Year 2019 3. First author

    Diller 4. Task 分類(診断と症状と予後) 5. Model RNN&LSTM 6. Summary RNNとLSTMの組み合わせて解析を行い、成人先天性心疾患患者10019人の診断と予後を 自動的に導き出すために、63326通の医学書を含む18年間のデータを用いた。 自然言語処理を用いて、医学書簡から診断(精度91%)と症状(精度90.6%)を抽出した また、同じデータを用いた予後予測も有用であった。 42
  43. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 43
  44. 注意点と制限事項 オーバーフィット(過学習)しやすい オーバーフィットとは? 訓練データセットでは非常に高い性能を示すが、新しいデータセット では一般化に失敗すること(汎化性能がない) 確立されたモデルを全く新しいテストデータでテストすることはAI研究に必須となる 44

  45. 45

  46. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 46
  47. 実施に向けた課題と⽅向性 1.プライバシーの問題 2.法的・倫理的な問題 3.責任の所在の問題 現時点での課題 47

  48. 今後の方向性 1,人工データの利用 プライバシーやコストの懸念がないため、 多数の患者を必要とする臨床研究では強力なツールとなる 2,スマートデバイスの開発と普及 膨大なデータをAIを用いて統合することで、 より詳細な疾患の表現型の把握や個別化医療が現実的になる 48

  49. T A B L E O F C O N

    T E N T S CHAPTER3 AIの基礎知識 CHAPTER4 AIと統計学 CHAPTER1 自己紹介 CHAPTER2 Introduction CHAPTER5 アルゴリズム CHAPTER6 循環器データへの 応用 CHAPTER7 注意点と制限事項 CHAPTER8 課題と方向性 CHAPTER9 Conclusion 49
  50. • ビッグデータとマシンパワーの普及:医療の実践と研究の基礎が変わってくる • 統計学は、単純なデータセットや因果関係の評価には依然として高い効果を発揮する • 臨床実践や研究の多くの分野では、今後AIを用いたビッグデータの強力な予測と探索が牽引していく • 非構造化データを解析するAIの能力は、心血管研究の分野を拡大していく さらに、AIは、モバイルヘルス、計算モデル化、合成データ生成への貢献をさらに高め、その法的・倫理的な問題は 解決されていくだろう

    • AIの成果を解釈するためには、生理学と疾患メカニズムの深い理解が最重要である • 最新の医学知識を理解し、斬新な医療機器を使用するためには、AIリテラシーが不可欠になるだろう 結論(Conclusion) 50