Upgrade to Pro — share decks privately, control downloads, hide ads and more …

(Neurips 2024) HEST-1k: A Dataset for Spatial ...

Avatar for Kazuya Nishimura Kazuya Nishimura
April 23, 2025
3

(Neurips 2024) HEST-1k: A Dataset for Spatial Transcriptomics and Histology Image Analysis

Avatar for Kazuya Nishimura

Kazuya Nishimura

April 23, 2025
Tweet

Transcript

  1. 13F 勉強会 HEST-1k: A Dataset for Spatial Transcriptomics and Histology

    Image Analysis 計算生命科学ユニット 特任研究員 西村和也
  2. 自己紹介  名前: 西村和也  学歴:~2019年3月 松江高専 2019年4月~2024年3月 九州大学 博士(情報科学)

    2024年4月~ 国立がん研究センター 特任研究員 (学振PD)  研究内容: バイオメディカル画像認識, パターン認識, Label-efficient learning 細胞画像解析 [MICCAI 2019, 2021, 2023, ECCV2020, WACV2023] 内視鏡画像解析 [MICCAI 2024] 病理画像解析 Multiple-InstanceLearning [MICCAI W 2023]
  3. 本日紹介する論文の概要 論文概要:画像と空間トランスクリプト-ムのデータセットの論文 1,108 の 画像×空間トランスクリプト-ムのペアのデータセットを公開! 1. 統一した扱い方を整備 2. 画像xSTの benchmark

    を確立 3. HEST1k を用いた知識発見の方法を提案 4. Multimodal learning を検証 本日考えたいこと 画像×空間トランスクリプト-ムで何ができそう?
  4. 本日紹介する論文の概要 論文概要:画像と空間トランスクリプト-ムのデータセットの論文 1,108 の 画像×空間トランスクリプト-ムのペアのデータセットを公開! 1. 統一した扱い方を整備 2. 画像xSTの benchmark

    を確立 3. HEST1k を用いた知識発見の方法を提案 4. Multimodal learning を検証 本日考えたいこと 画像×空間トランスクリプト-ムで何ができそう?
  5. 画像 x STの benchmark を確立 画像が遺伝子発現の情報を取得しているかを検証する共通のタスクを設定 Neural Network 基盤モデル (大量のデータで学習したモデル)

    … 特徴 Benchmark:AI モデルの性能を評価する共通のタスク Downstream tasks 例:肺がんの分類 腫瘍領域の認識 など 様々なタスクでモデルの 性能を検証
  6. Benchmark のタスク 9種類の人間のがんを対象に10個のタスクを設定 (選定方法は不明) 推定結果と観測値との相関で評価 タスク 臓器 がん種 発現の多い50の遺伝子の 遺伝子発現推定

    Breast IDC Prostate PRAD Pancreatic PPAD Skin SKCM Colon COAD Rectum READ Kidney ccRCC Liver HCC Lung LUAD axillary lymph nodes IDC 病理医でも難しいタスク 本当に推定できるか不明?
  7. HEST1k を用いた知識発見の方法 (1/2) IDC Xenium samples でGATA3 と neoplastic nuclei

    Breast cancer で発現する遺伝子 画像認識で細胞形状を認識 細胞の大きさで色付け 細胞のサイズと遺伝子発現をプロット 細胞の短径と遺伝子発現をプロット
  8. Multimodal learning finetuning の効果 CONCH という基盤モデルを学習 invasive breast cancer の5

    枚のXenium を用いて学習 ER, PR, and HER2 の発現を2値で推定 軽微に性能向上
  9. まとめ 1,108 の 画像×空間トランスクリプト-ムのペアのデータセットを公開! 1. 統一した扱い方を整備 2. 画像xSTの benchmark を確立

    3. HEST1k を用いた知識発見の方法を提案 4. Multimodal learning を検証 課題: 1. Benchmark で推定している遺伝子が画像に紐づいているとは限らない 2. Multi-modal な学習の効果が少ない 3. 複数の観測技術を統合する手法が必要
  10. 補足:画像×空間トランスクリプト-ムを扱うためには とにかく大きなデータセットを作り 全てのデータを model で学習してしまおう! Stable diffusion, GPT などの登場! 画像をはじめとする深層学習の流れ

    Visium HD, Xenium Visium ST 解像度 低い 高い 観測技術 乳がん 肺がん 脳腫瘍 大腸がん 食道がん 胃がん 膀胱がん 観測技術 組織 2種類のbatch effect を統合して扱う必要あり ※色が患者に対応 HER2-positive 乳がんの患者毎の 遺伝子発現データ 患者間で観測値にばらつきが生じる 患者毎に観測 値がシフト