金_kaggle_hubmap_202307_instance-segmenataion

Slide 1

Slide 1 text

Platform Technology Division Copyright 2020 Sony Semiconductor Solutions Corporation DATE 1/xx サマリ：概要に解法リンク • 参加コンペ： – HuBMAP - Hacking the Human Vasculature – 概要は右参照 • 順位： – 10位/1064チーム（ゴールド） • アプローチ概要： – YoloV7 Instance Seg 5foldと、疑似ラベルによるデータ水増し • チームについて： – 社内勉強会メンバを収集。 • Sugupoko submi割合 87/127投稿！貢献割合はでかいと思う。。。 • 所感： – 全体： • 専門ラベル、素人ラベル、未ラベル全てをどう使うかがポイントなコンペに感じた。 • LBとPBが相関していたので提出に迷いはなかった。（privateはそんな良くなかったけど。。） • 疑似ラベルを付与して良いものを選定するという、過去のコンペのソリューションを参考にしたおかげで性能が出たと思う。 • 20230803時点で公開されてる上位のソリューションは基本的に疑似ラベルあるので、思想は同じと思う。 – マインド面： • モチベーションコントロールが難しかった・・・ • 途中から性能が上がらずモチベーション低下・・・ • まだまだモチベーションコントロールと実験量が３流だな、、、と反省。コンペ概要細胞のインスタンスセグメンテーションを実施（血管、糸球体、分からない）血管の検出結果だけがスコアリングされる。 ①専門家ラベラーデータ、②素人ラベラーのデータ、③ラベル無しが配布結果

Slide 2

Slide 2 text

Platform Technology Division Copyright 2020 Sony Semiconductor Solutions Corporation DATE 2/xx コンペ概要 ★コンテストの目的この競争の目的は、毛細血管、細動脈、細静脈などの微小血管構造のインスタンスをセグメント化することです。健康なヒト腎臓組織のスライドから 2D PAS 染色された組織像画像でトレーニングされたモデルを作成します。微小血管構造のセグメンテーションを自動化するあなたの助けは、血管が人間の組織にどのように配置されているかについての研究者の理解を改善するでしょう。 ★文脈あなたの体の臓器や組織の適切な機能は、あなたの細胞の相互作用、空間組織化、および特殊化に依存します—それらの37 兆個すべて。非常に多くの細胞があるため、それらの機能と関係を決定することは途方もない仕事です。細胞をマッピングするための現在の取り組みには、人体の血液血管系を主要なナビゲーションシステムとして使用する血管系共通座標フレームワーク(VCCF)が含まれます。VCCFは、全身レベルから単一細胞レベルまで、すべてのスケールレベルを横断し、毛細血管構造をアドレスとして使用して細胞の位置を特定する独自の方法を提供します。しかし、研究者が微小血管系について知っていることのギャップは、VCCFのギャップにつながります。微小血管系の配置を自動的にセグメント化できれば、研究者は実世界の組織データを使用して、それらのギャップを埋め、血管系をマッピングし始めることができます。コンペティションホストのHuman BioMolecular Atlas Program(HuBMAP)は、人体の健康な細胞をマッピングするためのオープンでグローバルなプラットフォームを開発したいと考えています。HuBMAPの研究者は、最新の分子生物学および細胞生物学技術を使用して、細胞が体全体で互いに持っている接続を研究しています。微小血管系に関してはまだ多くの未知数がありますが、機械学習の洞察により、研究者は利用可能な組織データを使用して、これらの小さな血管が体全体にどのように配置されているかについての理解を深めることができます。最終的には、細胞間の関係が私たちの健康にどのように影響するかを特定する血管共通座標フレームワーク(VCCF)とヒューマンリファレンスアトラス(HRA)の構築への道を開くのに役立ちます。

Slide 14

Slide 14 text

Platform Technology Division Copyright 2020 Sony Semiconductor Solutions Corporation DATE 14/xx やることリスト • やり残し – ラベルの修正（変にインスタンスが分割されてる部分がある）コンペ理解（結局血管だけでいいんだっけ？） • 血管のみでした。 – 推論時に半tileずらしで推論（画面端の高精度化） – stain tool？で水増し。（色？HSV水増しの調整） • もしくはStyle transfer (https://github.com/bethgelab/stylize-datasets) – 2段回認識（どうしてもインスタンスの認識ミスが出る。。。） • Mask-rcnnの形。検出、セグのところをアンサンブル – MultilabelStratifiedKFold with 5 folds (https://github.com/trent-b/iterative-stratification) – Domain generalization – セルの大きさに対する性能の可視化⇒解像度問題 • Sugupoko – 済：２週疑似ラベル付与。 • 失敗・・・ – 済：yolov7、ds2でpretrain。Ds1で本学習 – 済：Dataset3に疑似ラベル付けて学習（疑似ラベルはyolov8xでつけてもいいかも） • How:疑似ラベル付与⇒タイル内の平均Confidenceが0.6以上のタイルのみ学習に利用 – 済：tileを結合して再生成したデータで学習 • Leakしないようにしなきゃいけない・・・(火山の時と同じような感じでやってみたが、ラベル付与ミスしてるっぽい。） – 済Yoloの解像度を上げて提出 – 済yoloのアンサンブルを修正 – 済： WBFの理解と適応 – 済： Yolov7のパラメータ理解 – 済： Yolov7のTTA修正 • Flipは性能低下 – 済：アンサンブル – 済： Dataset2のラベル修正。ラベル抜けがあるっぽい？（疑似ラベルで修正？） • kfuji – Unet – Yolov8（学習と推論） • Hatakee – mmdetection

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text