Slide 1

Slide 1 text

RSNA Intracranial Hemorrhage Detection まとめ いのいち

Slide 2

Slide 2 text

- コンペのTop Page - 脳出血の種類( Hemorrhage types )を予測する。 - ラベルは各画像に計6ラベル 脳出血5種類:Intraparenchymal, Intraventricular, Subarachnoid, Subdural, Epidural 脳出血があるかないかの:Any - 評価指標は「weighted multi-label logarithmic loss」 コンペ序盤で「Any」のweightが2倍だとDiscussionで報告があった。 https://www.kaggle.com/c/rsna-intracranial-hemorrhage-detection/discussion/110461#latest-644045 About the Competition

Slide 3

Slide 3 text

About the Competition - 2 stage competition 1st stage: 2nd stageで使うモデルを作成し、それをサブミットする。データはtrain/testに分けられ ているが最終評価では新たに別のtestセットが用意された。 2nd stage: 1st stageで出したコードのみを用いて最終サブミットのcsvを作成する。基本的には Pathのみ変更可。データは1st stageのtrain/test合わせたものがtrainデータ(75万枚 くらい)。testデータとして12万枚くらいのデータが追加された。

Slide 4

Slide 4 text

Hemorrhage Types コンペの公式ページよりそのまま転用

Slide 5

Slide 5 text

Hemorrhage Types 陽性のデータ自体は結構少なかった。 しかし、同じ患者の連続スライスではラベルが似ているという性質があった。 連続スライスの扱い方は上位入賞者の間でも異なっており、様々な工夫が見られた。

Slide 6

Slide 6 text

Preprocessing - CT画像は濃淡情報のみを持っています。その値のことを 「CT値」と呼び空気が-1000、水が0、その相対値で表されま す。単位はCT値の発明者の名前にちなんでハンスフィールドユニット( HU)とも言われ、HUという表現はコンペの Discussionでもよく見かけました。 - CT画像で特定の組織を見たい時、目的の組織が検出される CT値をクリップしてきます。下の図が参考になるかと思 います。            CT適塾、CTの基礎、CT画像はCT値の分布図より

Slide 7

Slide 7 text

- 脳出血を見る際にお医者さんが実際参考にする領域は ... ・Brain Matter window : W:80 L:40 ・Blood/subdural window: W:130-300 L:50-100 ・Soft tissue window: W:350–400 L:20–60 ・Bone window: W:2800 L:600 ・Grey-white differentiation window: W:8 L:32 or W:40 L:40 このKernelが参考になりました。 L:Window levelのことで、目的のCT値の中心 W:Window widthのことで、Lを中心としたwindowの幅 このサイトが参考になりました 他にもSigmoidを使うと有効だという論文もあった。 論文:Practical Window Setting Optimization for Medical Image Deep Learning Preprocessing

Slide 8

Slide 8 text

- 僕が実際に使ったのはAppianさんのGithubを参考に、以下の右3つを使いました。 Preprocessing

Slide 9

Slide 9 text

Weighted Averaging 4 * pred_epoch3 + 2 * pred_epoch2 + 1 * pred_epoch1 Model - 5 CV (PatientID split) - 3 epochs (Downsamplingなし) - Augmentation (Flip, Rotation) - Each epoch 8 TTA - 各epochのtestに対する予測値を重みをつけて平均 - 各epochのtestに対する予測値で、 ・0.9以上の予測をしたラベルが1つ以上 ・全ての予測値が1e-5以下 この条件を満たすものを、その予測値を正解ラベルとして 次のEpochの訓練データに加えた。 - SEResNext50 : EfficientNetB4 = 3 : 1 この割合で出した予測値を最終結果とした。 SEResNext: Private 0.6121 EfficientNet: Private 0.6156 Ensemble: Private 0.6057 (168th...) 512 x 512 380 x 380 SEResNext50 EfficientNetB4 Appain’s windowing Pseudo label every epoch 0.9以上が1つ以上 or 全て1e-5以下

Slide 10

Slide 10 text

Top solutions 1st place solutions https://www.kaggle.com/c/rsna-intracranial-hemorrhage-detection/discussion/117210#latest-674908 その他、GoldメダルのSolutionのリンクをまとめたDiscussion https://www.kaggle.com/c/rsna-intracranial-hemorrhage-detection/discussion/117242#latest-676388 上位の解法について、随時まとめて更新する予定 .....(したい)