Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
眼科AIコンテスト2024_特別賞_Solution
Search
Akifumi Matsumoto
December 01, 2024
Science
0
480
眼科AIコンテスト2024_特別賞_Solution
第5回眼科AI学会総会で実施された眼科AIコンテスト2024での特別賞受賞講演資料です。今後参加される方々の参考になれば幸いです。
Akifumi Matsumoto
December 01, 2024
Tweet
Share
Other Decks in Science
See All in Science
タンパク質間相互作⽤を利⽤した⼈⼯知能による新しい薬剤遺伝⼦-疾患相互作⽤の同定
tagtag
0
110
AIによる科学の加速: 各領域での革新と共創の未来
masayamoriofficial
0
260
academist Prize 4期生 研究トーク延長戦!「美は世界を救う」っていうけど、どうやって?
jimpe_hitsuwari
0
440
baseballrによるMLBデータの抽出と階層ベイズモデルによる打率の推定 / TokyoR118
dropout009
2
610
実力評価性能を考慮した弓道高校生全国大会の大会制度設計の提案 / (konakalab presentation at MSS 2025.03)
konakalab
2
220
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
190
【RSJ2025】PAMIQ Core: リアルタイム継続学習のための⾮同期推論・学習フレームワーク
gesonanko
0
310
MCMCのR-hatは分散分析である
moricup
0
510
ランサムウェア対策にも考慮したVMware、Hyper-V、Azure、AWS間のリアルタイムレプリケーション「Zerto」を徹底解説
climbteam
0
160
データベース08: 実体関連モデルとは?
trycycle
PRO
0
990
機械学習 - pandas入門
trycycle
PRO
0
360
Vibecoding for Product Managers
ibknadedeji
0
110
Featured
See All Featured
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.7k
Building an army of robots
kneath
306
46k
For a Future-Friendly Web
brad_frost
180
10k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
1
53
A better future with KSS
kneath
239
18k
Writing Fast Ruby
sferik
630
62k
Automating Front-end Workflow
addyosmani
1371
200k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
We Have a Design System, Now What?
morganepeng
54
7.9k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
How GitHub (no longer) Works
holman
315
140k
Fireside Chat
paigeccino
41
3.7k
Transcript
第5回眼科AI学会総会 眼科AIコンテスト解析内容
解析環境 【解析環境】 Google Colaboratory (使用GPU:A100) 【使用したプログラミング言語】 Python 【主に使用したライブラリ】 Pytorch Lightning,
timm, AutoGluon クラウド上の環境構築済みの解析環境を使用した
解法の全体像 前処理 モデル構築 アンサンブル 引用: http://www.joir.jp/data/
前処理:Ben‘s Preprocessing ・2015年にKaggleで開催された糖尿病網膜症の重症度を予測する 「Diabetic Retinopathy Detection」で有効と報告された。 ・ 画像の各ピクセルについて、その周囲の一定範囲内のピクセルの平均 的な色(局所平均)を計算し、その値を各ピクセルから引く。 ・局所平均色を「50%グレー」、RGB値が約
(128, 128, 128) の中間的な明 るさになるように補正する。 Graham B. Kaggle diabetic retinopathy detection competition report. University of Warwick; 2015.
モデル構築時に工夫したこと ①画像分類モデルと特徴量抽出モデル、表データモデルを使用し、 異なるアプローチで汎化性能の向上を目的とした。 ②特徴量抽出モデルでは、多くの眼底写真を学習済みである公開モデル を使用することで、汎化性能の向上に取り組んだ。 ③より正確な性能評価を実施するため全モデルで5-Fold Cross Validationを 用いて、性能評価および予測を実施した。 ④画像分類モデルでは、データ拡張を訓練時のみではなく、予測時にも
回転等のデータ拡張を実施するTest Time Augmentation (TTA)を採用した。
①画像分類モデル 学習用データ 予測結果 訓練 1 2 (例)眼底写真 引用: http://www.joir.jp/data/ 分類
メタボリックシンドローム あり: 0.80 なし: 0.20 尤度 画像からMETSを予測するモデル
使用した事前学習済モデル一覧 1.efficientvit_b2.r288_in1k 2.tiny_vit_21m_384.dist_in22k_ft_in1k 3.xcit_small_12_p16_224.fb_dist_in1k 4.coatnet_2_rw_224.sw_in12k_ft_in1k 5.tf_efficientnet_b3.ns_jft_in1k 6.inception_next_tiny.sail_in1k 7.efficientnetv2_rw_m.agc_in1k 8.convformer_m36.sail_in22k_ft_in1k 9.wide_resnet50_2.racm_in1k
10.mobilenetv3_large_100.ra_in1k 11.efficientnet_b0.ra_in1k 様々な構造を持つモデルを構築した
②特徴量抽出モデル【RETFound, RET-CLIP】 学習用データ 特徴量 公開モデル 1 2 (例)眼底写真 引用: http://www.joir.jp/data/
特徴量 画像から特徴量(表データ)を抽出 Feature1 Featuer2 File1 1.3438 -3.5634 File2 -2.5326 3.6456
基盤モデル:RETFound ・2023年Nature誌に掲載、160万枚の眼底写真を学習した基盤モデル ・糖尿病性網膜症や緑内障などの眼疾患以外にも、パーキンソン病、脳 卒中、心不全などの全身疾患の発症を予測するといった様々なタスクに 応用が可能 https://github.com/rmaphoh/RETFound_MAE
基盤モデル:RET-CLIP ・2024年arXivに掲載、約39万枚の眼底写真を学習した基盤モデル ・画像と診療情報に関するテキストデータの両方の特徴を学習しており、 様々な眼疾患の診断タスクにおいてより高精度な病期を含めた診断が可 能となる。 https://github.com/sStonemason/RET-CLIP
③年齢推定モデル【JOIR年齢推定モデル】 学習用データ 年齢 公開モデル 1 2 (例)眼底写真 引用: http://www.joir.jp/data/ 回帰
JOIR公開モデルを用いて年齢を予測した Age File1 49 File2 28
年齢評価モデル<JOIR> ・Japan Ocular Imaging Registryで収集されたデータを用いて、 眼底写真から年齢を推定する公開モデル ・健康診断施設(単施設)より収集した眼底異常所見がなく、身体状況 が健康であった12,734人12,734枚のデータを使用 ・実年齢とAIモデルが予測した 年齢との平均的な絶対値の誤差が2.39歳
という性能で予測可能なモデル http://www.joir.jp/data/
④抽出した特徴量による表形式モデル 学習用データ 学習 (精度で評価) 1 (例)表データ 表データから予測するAutoMLに基づくモデルを構築 Feature1 Featuer2 Age
File1 1.3438 -3.5634 49 File2 -2.5326 3.6456 28 予測結果 2 分類 メタボリックシンドローム あり: 0.80 なし: 0.20 予測確率 1. RETFound特徴量 + 予測年齢 2. RET-CLIP特徴量 + 予測年齢
AutoGluon 数行のコードで性能の高いモデルが構築可能なAutoML ・表データに対する機械学習モデルを自動で構築。 ・データの前処理、モデルの選択、チューニングまでを自動化する。 (参考)
⑤アンサンブルモデル 画像分類モデル 1.efficientvit_b2.r288_in1k 2.tiny_vit_21m_384.dist_in22k_ft_in1k 3.xcit_small_12_p16_224.fb_dist_in1k 4.coatnet_2_rw_224.sw_in12k_ft_in1k 5.tf_efficientnet_b3.ns_jft_in1k 6.inception_next_tiny.sail_in1k 7.efficientnetv2_rw_m.agc_in1k 8.convformer_m36.sail_in22k_ft_in1k
9.wide_resnet50_2.racm_in1k 10.mobilenetv3_large_100.ra_in1k 11.efficientnet_b0.ra_in1k 加重平均 アンサンブル モデル① 表データモデル 1. RETFound特徴量 + 予測年齢 2. RET-CLIP特徴量 + 予測年齢 平均精度: 0.6666 平均精度: 0.6372 平均精度: 0.6428 加重平均 アンサンブル モデル② 平均精度: 0.6676 異なる複数のモデルを検討し、汎化性能の向上を目指した
最後に ・このような画像における実践的なディープラーニングの学習機会を設 けていただきました日本眼科AI学会及び関係者の皆様に感謝申し上げま す。 ・画像解析の経験がない状態でしたが、画像解析自体はハードルが高く ないものであることを実感できたとともに、画像による分類というタス ク1つに対して無数のアプローチが存在することに感銘を受けました。 ・今後も機械学習の勉強、今回習得した技術を医療に貢献できるように チャレンジしていきたいと思います。