Upgrade to Pro — share decks privately, control downloads, hide ads and more …

医療支援AI開発における臨床と情報学の連携を円滑に進めるために

Masahiro Oda
November 12, 2024

 医療支援AI開発における臨床と情報学の連携を円滑に進めるために

Masahiro Oda

November 12, 2024
Tweet

More Decks by Masahiro Oda

Other Decks in Research

Transcript

  1. タスク選定(1/2) • どのようなAIを開発するか選定 – 臨床ニーズとAI技術の実現可能性のバランスを考慮 – 最初から本格的なタスク解決に取り組むと,結果が得られるまで時間がかかり 臨床側と情報側双方にフラストレーション 4 臨床

    情報 • スモールスタート – 最初はシンプルなタスク設定でAI試作 – 期間は数か月~半年で実施 – 試作結果から次のタスク選定 • 利点 – 臨床側と情報側が互いの理解を深められる – チームに最適なタスク設定が可能 – 状況に応じたチーム拡大が容易
  2. 医療支援AI開発 6 外部資金 タスク選定 データ整備 AI開発 評価 知財確保 論文化 事業化など

    タスク選定 データ整備 AI開発 評価 スモールスタート(数か月~半年間) 本格的研究(2,3年間)
  3. 医療支援AI開発 7 外部資金 タスク選定 データ整備 AI開発 評価 知財確保 論文化 事業化など

    タスク選定 データ整備 AI開発 評価 スモールスタート(数か月~半年間) 本格的研究(2,3年間)
  4. データ整備(1/3) • AI構築に必要なデータ収集とアノテーション付与 – データ整備の必要性について臨床側と情報側の意識合わせが必要 – データを何件集めないといけないのか? – アノテーションの負担を軽減できないか? 8

    学習に用いる 症例数 期待されるAIの性能 ~500例 正解率50~70% 5,000例程度 正解率80~90%, 非専門医を上回る場合あり 50,000例程度 正解率90%以上, 専門医に迫る結果 100,000例~ 基盤モデル開発などに発展 症例数と期待されるAIの性能 (大まかな目安) 臨床 情報 • 収集するデータ数の検討 – 目標とするAI性能から収集データ数見積り – 類似研究の論文を参考にする 画像数では なく症例数
  5. データ整備(2/3) • Segment Anything Model (SAM / SAM 2)[2,3] –

    様々な画像からセグメンテーションできる汎用的モデル(基盤モデル) – 学習なしで医用画像にも適用可能 – アノテーション作成の補助に利用可能 9 • アノテーションの負担軽減 – より簡単なアノテーションの種類を選択 – AIによるアノテーション補助を活用 Movies from https://segment-anything.com/ [2] Kirillov A., et al., Segment Anything, arXiv:2304.02643, 2023 [3] Ravi N., et al., SAM 2: Segment Anything in Images and Videos, https://ai.meta.com/research/publications/sam-2-segment-anything-in-images-and-videos/, 2024 臨床 情報
  6. データ整備(3/3) • Segment Anything Model (SAM / SAM 2) [2,3]

    – 領域アノテーション作成の補助に利用可能 • 全自動で 領域切り出し • 矩形領域を指定し 領域切り出し 10 [2] Kirillov A., et al., Segment Anything, arXiv:2304.02643, 2023 [3] Ravi N., et al., SAM 2: Segment Anything in Images and Videos, https://ai.meta.com/research/publications/sam-2-segment-anything-in-images-and-videos/, 2024 臨床 情報 ・術具は良い結果 ・臓器や組織は 部分的に出せる ・ガーゼが2領域に 分割されてしまった ・ガーゼとIMAの位置 を矩形で指定するこ とで高精度に切り出 し可能
  7. 医療支援AI開発 11 外部資金 タスク選定 データ整備 AI開発 評価 知財確保 論文化 事業化など

    タスク選定 データ整備 AI開発 評価 スモールスタート(数か月~半年間) 本格的研究(2,3年間)
  8. AI開発(1/2) • データドリブンなAI開発 – AI研究はライバルが多く,開発が遅れると他グループに追い越される – アノテーション付きデータが手に入りにくい 12 臨床 情報

    画像処理手法の分類 深層学習ベースの主要な手法 便利なライブラリ 画像分類 CNN系(ResNet, EfficientNet,…),ViT系 tf.keras.applications, torchvision.models 物体検出 R-CNN系,YOLO系(v3,…,11) MMDetection セグメンテーション FCN系(U-Net, nnU-Net,…), FCN+ViT系(UNETR, Swin UNETR,…) MONAI 画像ドメイン変換 GAN系(CycleGAN, StyleGAN,…) • AI開発の期間短縮の工夫 – 基本的なAI手法のコードを手元に整備し,すぐ使用可能にしておく
  9. AI開発(2/2) 13 • アノテーション無しデータもAI学習に利用可能にする手法の利用 – Semi-/Un-/Self-supervised learningの利用 – セグメンテーションなどで多くの手法が登場 [4]

    Qin An, et al., HTSeg: Hybrid Two-stage Segmentation Framework for Intestine Segmentation from CT Volumes, MICCAI CLIP Workshop, 2024 [5] Ruiyun Zhu, et al., Semi-supervised Tubular Structure Segmentation with Cross Geometry and Hausdorff Distance Consistency, MICCAI 2024, LNCS 15008, 612-622, 2024
  10. 共同研究実施において役立つこと • 専門知識の共有と理解 – 医学:解剖,疾患,診断と治療の過程 – 情報:AIの性質と限界,学習と推定,評価方法,データのバイアス • 定期的なミーティング実施 –

    月1回ほど実施し進捗と課題の共有 • データ整備で気を付けること – データのファイル名やフォルダ名に,日本語やスペースの使用を避ける – ファイル名,アノテーションの命名規則統一 14 臨床 情報
  11. むすび • 医療支援AI開発の経験に基づく臨床-情報の連携の知見を紹介 • タスク選定 – スモールスタートな研究実施を推奨 • データ整備 –

    収集するデータ数決定の考え方 – アノテーション作成の負担軽減 • AI開発 – 開発期間短縮の工夫 – アノテーションが無いデータも学習に利用可能に 15