Slide 73
Slide 73 text
© 20231229 @Tdys13 73
Vision Language Model / Large Vision Foundation Model領域の新提案
・論⽂引⽤
Ma, DongAo, et al. "Foundation Ark: Accruing and Reusing Knowledge for Superior and Robust Performance."
International Conference on Medical Image Computing and Computer-Assisted Intervention. Cham: Springer Nature Switzerland, 2023.
ü 複数の胸部X線データセットを学習
(a) Linear probingの結果
1,2,10においてArk-6はAUCが⼤きく上回っている
また3においてはArk-6とCXR-FMと同等
(b) ⼩規模データ環境において認識精度がArk-5,6ともにCXR-FMを上回っている
Arkモデルがより少ない学習データで⾼品質の表現を捉えることが出来る
(a) 性別における偽陰性率(FN Rate)
⽐較した結果、Arkモデルは性別の不均衡データに対して頑健である
ことが判明した。
(b) 推論時に⼥性患者データを⼊⼒した際のAUC
緑円はCXR-FMだが、Arkモデルより差が開いている。