眼科AIコンテスト2024_特別賞_6位Solution

第5回眼科AI学会総会眼科AIコンテスト解析内容

解析環境【解析環境】 Google Colaboratory （使用GPU：A100）【使用したプログラミング言語】 Python 【主に使用したライブラリ】 Pytorch Lightning,
timm, AutoGluon クラウド上の環境構築済みの解析環境を使用した

解法の全体像前処理モデル構築アンサンブル引用： http://www.joir.jp/data/

前処理：Ben‘s Preprocessing ・2015年にKaggleで開催された糖尿病網膜症の重症度を予測する「Diabetic Retinopathy Detection」で有効と報告された。・画像の各ピクセルについて、その周囲の一定範囲内のピクセルの平均的な色（局所平均）を計算し、その値を各ピクセルから引く。・局所平均色を「50%グレー」、RGB値が約
(128, 128, 128) の中間的な明るさになるように補正する。 Graham B. Kaggle diabetic retinopathy detection competition report. University of Warwick; 2015.

モデル構築時に工夫したこと ①画像分類モデルと特徴量抽出モデル、表データモデルを使用し、異なるアプローチで汎化性能の向上を目的とした。 ②特徴量抽出モデルでは、多くの眼底写真を学習済みである公開モデルを使用することで、汎化性能の向上に取り組んだ。 ③より正確な性能評価を実施するため全モデルで5-Fold Cross Validationを用いて、性能評価および予測を実施した。 ④画像分類モデルでは、データ拡張を訓練時のみではなく、予測時にも
回転等のデータ拡張を実施するTest Time Augmentation (TTA)を採用した。

①画像分類モデル学習用データ予測結果訓練 1 2 （例）眼底写真引用： http://www.joir.jp/data/ 分類
メタボリックシンドロームあり: 0.80 なし: 0.20 尤度画像からMETSを予測するモデル

使用した事前学習済モデル一覧 1.efficientvit_b2.r288_in1k 2.tiny_vit_21m_384.dist_in22k_ft_in1k 3.xcit_small_12_p16_224.fb_dist_in1k 4.coatnet_2_rw_224.sw_in12k_ft_in1k 5.tf_efficientnet_b3.ns_jft_in1k 6.inception_next_tiny.sail_in1k 7.efficientnetv2_rw_m.agc_in1k 8.convformer_m36.sail_in22k_ft_in1k 9.wide_resnet50_2.racm_in1k
10.mobilenetv3_large_100.ra_in1k 11.efficientnet_b0.ra_in1k 様々な構造を持つモデルを構築した

②特徴量抽出モデル【RETFound, RET-CLIP】学習用データ特徴量公開モデル 1 2 （例）眼底写真引用： http://www.joir.jp/data/
特徴量画像から特徴量（表データ）を抽出 Feature1 Featuer2 File1 1.3438 -3.5634 File2 -2.5326 3.6456

基盤モデル：RETFound ・2023年Nature誌に掲載、160万枚の眼底写真を学習した基盤モデル・糖尿病性網膜症や緑内障などの眼疾患以外にも、パーキンソン病、脳卒中、心不全などの全身疾患の発症を予測するといった様々なタスクに応用が可能 https://github.com/rmaphoh/RETFound_MAE

基盤モデル：RET-CLIP ・2024年arXivに掲載、約39万枚の眼底写真を学習した基盤モデル・画像と診療情報に関するテキストデータの両方の特徴を学習しており、様々な眼疾患の診断タスクにおいてより高精度な病期を含めた診断が可能となる。 https://github.com/sStonemason/RET-CLIP

③年齢推定モデル【JOIR年齢推定モデル】学習用データ年齢公開モデル 1 2 （例）眼底写真引用： http://www.joir.jp/data/ 回帰
JOIR公開モデルを用いて年齢を予測した Age File1 49 File2 28

年齢評価モデル＜JOIR＞・Japan Ocular Imaging Registryで収集されたデータを用いて、眼底写真から年齢を推定する公開モデル・健康診断施設（単施設）より収集した眼底異常所見がなく、身体状況が健康であった12,734人12,734枚のデータを使用・実年齢とAIモデルが予測した年齢との平均的な絶対値の誤差が2.39歳
という性能で予測可能なモデル http://www.joir.jp/data/

④抽出した特徴量による表形式モデル学習用データ学習（精度で評価） 1 （例）表データ表データから予測するAutoMLに基づくモデルを構築 Feature1 Featuer2 Age
File1 1.3438 -3.5634 49 File2 -2.5326 3.6456 28 予測結果 2 分類メタボリックシンドロームあり: 0.80 なし: 0.20 予測確率 1. RETFound特徴量 + 予測年齢 2. RET-CLIP特徴量 + 予測年齢

AutoGluon 数行のコードで性能の高いモデルが構築可能なAutoML ・表データに対する機械学習モデルを自動で構築。・データの前処理、モデルの選択、チューニングまでを自動化する。（参考）

⑤アンサンブルモデル画像分類モデル 1.efficientvit_b2.r288_in1k 2.tiny_vit_21m_384.dist_in22k_ft_in1k 3.xcit_small_12_p16_224.fb_dist_in1k 4.coatnet_2_rw_224.sw_in12k_ft_in1k 5.tf_efficientnet_b3.ns_jft_in1k 6.inception_next_tiny.sail_in1k 7.efficientnetv2_rw_m.agc_in1k 8.convformer_m36.sail_in22k_ft_in1k
9.wide_resnet50_2.racm_in1k 10.mobilenetv3_large_100.ra_in1k 11.efficientnet_b0.ra_in1k 加重平均アンサンブルモデル① 表データモデル 1. RETFound特徴量 + 予測年齢 2. RET-CLIP特徴量 + 予測年齢平均精度: 0.6666 平均精度: 0.6372 平均精度: 0.6428 加重平均アンサンブルモデル② 平均精度: 0.6676 異なる複数のモデルを検討し、汎化性能の向上を目指した

最後に・このような画像における実践的なディープラーニングの学習機会を設けていただきました日本眼科AI学会及び関係者の皆様に感謝申し上げます。・画像解析の経験がない状態でしたが、画像解析自体はハードルが高くないものであることを実感できたとともに、画像による分類というタスク1つに対して無数のアプローチが存在することに感銘を受けました。・今後も機械学習の勉強、今回習得した技術を医療に貢献できるようにチャレンジしていきたいと思います。

眼科AIコンテスト2024_特別賞_6位Solution

眼科AIコンテスト2024_特別賞_6位Solution

Akifumi Matsumoto

Other Decks in Science

Featured

Transcript

第5回眼科AI学会総会眼科AIコンテスト解析内容

解析環境【解析環境】 Google Colaboratory （使用GPU：A100）【使用したプログラミング言語】 Python 【主に使用したライブラリ】 Pytorch Lightning,

解法の全体像前処理モデル構築アンサンブル引用： http://www.joir.jp/data/

①画像分類モデル学習用データ予測結果訓練 1 2 （例）眼底写真引用： http://www.joir.jp/data/ 分類

②特徴量抽出モデル【RETFound, RET-CLIP】学習用データ特徴量公開モデル 1 2 （例）眼底写真引用： http://www.joir.jp/data/

③年齢推定モデル【JOIR年齢推定モデル】学習用データ年齢公開モデル 1 2 （例）眼底写真引用： http://www.joir.jp/data/ 回帰

④抽出した特徴量による表形式モデル学習用データ学習（精度で評価） 1 （例）表データ表データから予測するAutoMLに基づくモデルを構築 Feature1 Featuer2 Age

AutoGluon 数行のコードで性能の高いモデルが構築可能なAutoML ・表データに対する機械学習モデルを自動で構築。・データの前処理、モデルの選択、チューニングまでを自動化する。（参考）