Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

テンソル分解を用いた教師なし学習による変数選択法のシングルセルマルチオミックスデータ解析への応用

 テンソル分解を用いた教師なし学習による変数選択法のシングルセルマルチオミックスデータ解析への応用

presentation at SIGBIO78
https://www.ipsj.or.jp/kenkyukai/event/mps148bio78.html
2024/6/21

Y-h. Taguchi

June 21, 2024
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. SIGBIO78 6 Type of Measurements • scRNA-seq • scMethyl-seq •

    scATAC-seq Sample (〜103 single cells) vs 〜104 genes (scRNA-seq) 〜107 sites (scMethyl-seq, scATAC-seq) Large p small n problem
  2. SIGBIO78 8 統合解析手法:テンソル分解を用いた教師なし学習 による変数選択法 M N1 N2 N3 特異値分解 テンソル

    テンソル分解 x i k jk =∑ l=1 L u li k k λ l k v l jk x ljk =∑ i k =1 N k u li k x i k jk =∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l1 l2 l3 )ul 1 l ul 2 j ul 3 k M M
  3. SIGBIO78 10 j(single cell)に付与された特異値ベクト ルvlj ,ul2j とラベルの整合性チェック →カテゴリ回帰 v ljk

    =a lks δ js +b lk u l 2 j =a l 2 s δ js +b l 2 δjs :single cell j がラベルsの時1,それ以外は0
  4. SIGBIO78 12 u l 2 j ∈ℝL×M→ UMAP 個別プロファイル→ (L=10)

    2プロファイル統合→ (L=10×2) 全3プロファイル統合→ (L=10×3) Data set 1
  5. SIGBIO78 16 u 1i 1 =∑ l=1 L u 1

    l u li 1 1 Pi 1 =Pχ2 [> (u1i 1 σ l 2 )2 ] Benjamini-Hochberg基準で多重比較補正して 0.01以下の遺伝子のみ選択。 (k=1: RNA-seq) 累積χ2分布 (ガウス分布が帰無仮説)
  6. SIGBIO78 19 利点 • 一千万次元×細胞数の行列を扱える(疎行列な のでRのSparse Matrix Formatを使う)。 • 特異値分解も疎行列用の関数使用

    • 殆どが欠損値であってもそのまま扱える • 次元数が異なっている複数の行列を簡単に統 合解析可能。