Save 37% off PRO during our Black Friday Sale! »

臨床AIイントロダクション

A82e268e52c06ad69b83f1a251c682d4?s=47 Keisuke OGAKI
December 13, 2020

 臨床AIイントロダクション

非MLエンジニア向けに作成した、臨床AIの論文の紹介です45分程度のプレゼン用

A82e268e52c06ad69b83f1a251c682d4?s=128

Keisuke OGAKI

December 13, 2020
Tweet

Transcript

  1. Copyright © 2019 M3, Inc. All rights reserved. インターネットを活用し、 健康で楽しく長生きする人を1人でも増やし、

    不必要な医療コストを1円でも減らすこと AIイントロダクション ~最新医療AI論文20本を眺めながら~
  2. AI活用のためのステップ ときたい問題のデー タを集める データを説明する モデルを学習する 新しいデータで (前向きに)利用する • 後ろ向きに収集されたデータに示された入力と出力 を説明するモデルが学習され、そのモデル

    を用いて、前向きに臨床研究が行われる
  3. AI活用のためのステップ ときたい問題のデー タを集める データを説明する モデルを学習する 新しいデータで (前向きに)利用する • 後ろ向きに収集されたデータに示された 入力と出力を説明するモデルが学習され、そのモデル

    を用いて、前向きに臨床研究が行われる ディープラーニングによって変わったことの一つとし て、モデルはかなり汎用的であり、様々な問題に同 じ学習方法が使える。 医用画像の論文では、コンピュータビジョンの分野 の問題を解くためのモデルをそのまま医用画像でト レーニングすることが多い。 りんごを判定する問題とがんを診断する問題は データ以外全く一緒
  4. データの集め方からみる医用画像処理の3分類 模倣 変換 予測 12年後 生存してい る 乳がんの 疑いあり 曖昧な判断をへらす

    人間ではできないこ とができる 効率化 既存のワークフローでど のように利用するか 人間が解釈しにくい 問題の発見 ◦ ?
  5. データの集め方からみる医用画像処理の3分類 模倣 変換 未来予測 12年後 生存してい る 乳がんの 疑いあり

  6. 模倣 • 最も典型的な問題設定 ◦ 医学分野だと、独自のモデルを開発することは少なく、ほとんどが物体認識用のモ デル(いわゆる猫の判定をするやつ)に医用画像を覚えさせる • pros ◦ すなおな問題設定で、出力もわかりやすい

    ◦ 人間の医師との比較で検証もしやすい ▪ ほとんどの論文がここを根拠としている • cons ◦ 医師の仕事を置き換えて、“診断”を行うものなので ▪ 法規制が多い ▪ 既存のワークフローに入れにくい ◦ AIを考えて真っ先に思いつく利用先なので当然競合が多い 乳がんの疑 いあり(0~1)
  7. covid疑いあり Development and Evaluation of an AI System for COVID-19

    Diagnosis • 1. スライスごとに肺野の切り出し • 2. 切り出された肺野ごとに特徴抽出 • 3. 全スライスの特徴をマージして最終的な予測 1: CT画像からcovid-19の疑いを発見
  8. • このような、解剖学的な診断はもちろんAI化しやすい • 骨折・骨粗鬆症etc 2: X線画像から変形性関節症の診断 変形性関節症 “A preliminary examination

    of the diagnostic value of deep learning in hip osteoarthritis”
  9. 3: マンモグラフィからの乳がんの発見 “International evaluation of an AI system for breast

    cancer screening” 乳がん • 経験を積んだ医師ならマンモグラフィからで精度よく診断できる • メジャーな問題設定で、Google等の企業も取り組んでいる
  10. • このように、診断は画像の種類・疾患の種類によらず広く研究されている • モデルはやはり一般物体認識用のモデル 4: 眼底画像からの緑内障の診断 “Glaucoma Diagnosis with Machine

    Learning Based on Optical Coherence Tomography and Color Fundus Images” 緑内障
  11. • 動画から誤差2程度で予測できる • 動画と痛みのデータセットが2011年に公開されており、盛んに研究されている 5: 動画から痛みのスコア(VAS)を判定 9 6 6 痛み度合い

    “Pain Evaluation in Video using Extended Multitask Learning from Multidimensional Measurements” “Painful data: The UNBC-McMaster shoulder pain expression archive database”
  12. データの集め方からみる医用画像処理の3分類 模倣 変換 未来予測 12年後 生存してい る 乳がんの 疑いあり

  13. 変換 • 模倣パターンと違い、同じ患者に対する2通りの違うデータを用意する ◦ 人間は介在しなくて良い場合もある! • 実は学習は人間の診断を模倣するよりも簡単な場合もある ◦ 模倣よりも正解がはっきりしていることが多い ◦

    1つの入力に対して、密なフィードバックが得られる ▪ つまりデータがたくさんあるのと似た効果 ◦ 機械的に得られるデータの場合、たくさん集めやすい • pros ◦ 既存の医療機器や検査を置き換えるものになりやすい ▪ 市場もわかりやすい ▪ 個人的にもオススメ ◦ あくまでも変換なので、人間が解釈できる • cons ◦ 模倣に比べると、いい問題を見つけるのが難しい ▪ 頭をつかう
  14. • 被曝が防げるからうれしい、というモチベーション ◦ 個人的にはMRIの方が辛いと思わなくもない... 6: MRIからCT画像をつくる! “Medical image synthesis with

    context-aware generative adversarial networks.”
  15. • なんでこんなことできるのか! ◦ X線は確かに1枚の画像であるが、深度の情報を含んでいるリッチな入力 7: X線2枚からCT画像をつくる! “X2CT-GAN: Reconstructing CT from

    Biplanar X-Rays with Generative Adversarial Networks” 2枚のX線から生成されたもの 本物のCT
  16. • 医師が詳細にラベルをふった画像をそのまま出力するように学習 ◦ なのでいちおう変換 • ちなみにこのようながん病変部位を見つける問題は非常にメジャーな問題で、公開デー タセットもいろいろなドメインで存在する 8: がんのセグメンテーション “Brain

    Tumor Segmentation using Convolutional Neural Networks in MRI Images” MRI画像 病変部位のアノテーション
  17. • 遺伝子解析を行わずとも、画像での発現量から直接ゲノム推定できる! • 既存のゲノム(トランスクリプトーム)解析に基づく研究と病理を繋ぐ可能性 9: 病理画像から遺伝子発現量に変換 “Transcriptomic learning for digital

    pathology” 病理画像 ゲノム情報
  18. • 染色作業すらも不要になることで検査結果が出るまでの時間をさらに短縮できる 10: バーチャル染色 “Virtual histological staining of unlabelled tissue-autofluorescence

    images via deep learning”
  19. 11: MRI撮影時間短縮 • Facebook fastMRI challenge • データの取得時間を短くした場合の画像劣化を AIに復元させた •

    画像は撮影時間を1/10程度に短縮した場合の実験結果 (single coil) AI補正結果 正解 入力劣化画像
  20. 12: CT画像補正 • 低線量化あるいは撮影時間短縮した場合の画像劣化を補正 • 従来手法より高画質,高速 High quality imaging from

    sparsely sampled computed tomography data with deep learning and wavelet transform in various domains, Lee, Choi, et.al., 2018 Low-Dose CT with a Residual Encoder-Decoder Convolutional Neural Network (RED-CNN), Chen, Yi Zhang, 2017
  21. データの集め方からみる医用画像処理の3分類 模倣 変換 未来予測 12年後 生存してい る 乳がんの 疑いあり

  22. 未来予測 • 入力は検査機器、出力は未来の”事実”、人間の判断を介在させない ◦ 学習時は過去の検査で学習する • 模倣とは違って、人間には出来ていないこともスコープに入る ◦ 人間はもっとざっくりした予測しかできないのを高精度化 ◦

    人間は複数の要因をうまく扱えない • pros ◦ 複雑な要因を扱えるため、人間の気づいていない条件にも気づける • cons ◦ 医師が結果を解釈できない。5年生存と言われても判断根拠がわからない
  23. 13: 大腸がんで病理画像から5年生存の予測 • 人間が理解しやすい悪性・良性の判断などに落とさずに、術後の経過を直接予測する “Deep learning based tissue analysis predicts

    outcome in colorectal cancer” 5年後 生存
  24. 14: 病気の指定なく、胸部X線画像から12年後の生存 を予測 • 問題設定は前述の大腸がんに似ているが、入力が胸部X線、診察時の症状を指定しな いという点が大きく異なる • その代わり8万+件というかなり大きめのデータセットを用いている “Deep Learning

    to Assess Long-term Mortality From Chest Radiographs” 生存 12年後
  25. • 免疫チェックポイント阻害剤により、がんの進行が抑えられるかどうかをがん組織の画 像から予測できる • また、副作用の予測への取り組みも行われている ◦ こちらができるようになると、よりインパクトがあると考えられる 15: 薬剤投与後に、効果が出るかの予測 がんの進行が

    抑えられたか 免疫チェックポイント阻害剤投与後 “Using machine learning algorithms to predict response and toxicity to immune checkpoint inhibitors (ICIs) in melanoma patients.”
  26. 16: 腫瘍マーカーの機械学習利用 • 各マーカーの基準値との比較との比較として用いられている腫瘍マーカーを複数まとめ て学習に用いることで、悪性・良性の判定を高精度に行う・性質の分類など、腫瘍の発 見以上のことができる • 逆にいま基準値ベースなのは、人間が検査をする以上、複雑すぎるモデルはミスを産 むから? ◦

    生存を予測するスコアなども存在するが非常にざっくり “Application of Artificial Intelligence for Preoperative Diagnostic and Prognostic Prediction in Epithelial Ovarian Cancer Based on Blood Biomarkers.” 手術後 悪性 or 良性 腫瘍マーカー タイプ予測 悪性 or 良性
  27. データの集め方からみる医用画像処理の3分類 模倣 変換 未来予測 12年後 生存してい る 乳がんの 疑いあり 人間ではできないこと

    x △ ◎ 曖昧な判断が入らない ◎ △ ◎ 効率化 ◦ ◎ - 解釈が困難 △ ◎ x
  28. 他のドメインでの例

  29. 17: 問診基準の改善(ADHD) “Use of machine learning for behavioral distinction of

    autism and ADHD” • ADHD/ASDを診断する初期の問診表の回答から、単純集計よりもよく予測できる • さらに、65項目の問診に対して、実は5項目で十分な精度が出ることもわかった • モチベーションは、ADHDを診断してほしい親が多すぎて、今アメリカでは結果が出るま で1年とか待たなきゃいけないらしい。それを解消するため 確定診断後 予測スコア ADHD
  30. 18: 電子カルテ情報からの急性腎不全の48時間前 予測 • Google DeepMind • すでに臨床での試験も行なっている ◦ Googleが資本を入れてる病院で実験しているよう?

    • 術後や他の疾患で入院中の患者が亡くなる原因として大きく、医 師に必要とされている どのデータがAIにとって重要だったかの分析 電子カルテで記録さ れるデータの時系列 未来の急性腎障害 48時間後 “A clinically applicable approach to continuous prediction of future acute kidney injury” 検査値ごとの未来予測
  31. 19: 超大規模データを用いた、電子カルテからの バーチャル問診 “Evaluation and accurate diagnoses of pediatric diseases

    using artificial intelligence” 左の肺の上葉 に病変が認めら れる... 上葉に影があ るか -> Yes • 方法論が面白い研究 ◦ 1. カルテからバーチャル問診を行うAIを作り、カルテのデータをデータベース化しや すくする ◦ 2. その後病名を別のAIで診断 • この方法で、定型でないカルテから複数の症状をまとめて診断できるようになった
  32. アドバンスド: 自動発見

  33. 自動発見 • 今までの3パターンのようにX -> Yが明確な形では無い • pros ◦ 正解を与える必要がなく、たくさんの画像があればよい •

    cons ◦ 人間に意味のある分類になるかは、やってみなければわからない ◦ 意味を後から人間が探さなければならない 例えば、自分自身を正解とした変換として問題を解く 中間の↑ココが似ているものは似た CT画像である
  34. 20: 腫瘍マーカーが似ているクラスタの自動発見 • 腫瘍マーカー同士の関係性を見るために、クラスタの自動発見を行なった • 2つのクラスタに分けたところ、術後の再発可能性とクラスタの間に関係が見つかった (事実との関係の発見) • このクラスタは既知の分類では無いので医学上の進歩につながる可能性がある “Application

    of Artificial Intelligence for Preoperative Diagnostic and Prognostic Prediction in Epithelial Ovarian Cancer Based on Blood Biomarkers.” マーカーの値 各患者
  35. • まずCT画像の小さな領域同士がにてるかにてないかを判定し、いくつかのクラスタに分 ける • その後CT画像全体を全部小さな領域に分ければ、CT画像の色ぬりができる • 浸潤がん・非浸潤がん・その他とほぼ一致した • という話だけど、できるならお金かけてラベルつけた方がいいと思う 21:

    CT画像を自動で塗り分け “Unsupervised Segmentation of 3D Medical Images Based on Clustering and Deep Representation Learning”
  36. • 自動的に発見されたラベルが、再発しやすさに関わっていることも検証した • 医学的な新しい発見に繋がることを示唆 22: 病理画像が似ている どれが似てる? “Automated acquisition of

    explainable knowledge from unannotated histopathology images”
  37. • 個人的にはこの分野は実用性があると思う • AI診断ではなく、あくまでも、過去に人間が診断したものを検索するという方針 • 実は学習に医学データセットは使ってない。公開の写真データセットだけで学習しても検 索ならばそこそこの精度が出る 23: 似ている病理画像を用いて組織アーカイブの検 索アプリを作る

    “Similar image search for histopathology: SMILY” どれが似てる?
  38. データの集め方からみる医用画像処理の3分類 模倣 変換 予測 12年後 生存してい る 乳がんの 疑いあり 曖昧な判断をへらす

    人間ではできないこ とができる 効率化 既存のワークフローでど のように利用するか 人間が解釈しにくい 問題の発見 ◦ ?