Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テンソル分解を用いた教師無し学習による変数選択法によるmiRNA/mRNA/プロテオームの統合解析

Y-h. Taguchi
December 06, 2020

 テンソル分解を用いた教師無し学習による変数選択法によるmiRNA/mRNA/プロテオームの統合解析

第64回バイオ情報学研究発表会
http://www.ipsj.or.jp/kenkyukai/event/bio64.html
における発表のプレゼンです

Y-h. Taguchi

December 06, 2020
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. SIGBIO64 2 特異値分解を用いた教師無 xij N M (uli)T N L vlj

    L M ⨉ ≈ x ij ≃∑ l=1 L u li λl v l j L L ⨉ λl N: 遺伝子総数 (i) M: サンプル分解を用いた教数 (j) xij: 遺伝子発現 例
  2. SIGBIO64 3 解を用いた教師無釈….. j:サンプル 健常者 患者 vlj i:遺伝子 uli DEG:

    Differentially Expressed Genes 発現差のある遺伝子の統合解析ある変数選択法によ遺伝子 とある変数選択法によ l 健常者 < 患者 DEG: DEG: 健常者 > 患者
  3. SIGBIO64 4 x ijk G u l1i u l2j u

    l3k L1 L2 L3 HOSVD (Higher Order Singular Value Decomposition) テンソル分解を用いた教に拡張….. N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k N: 遺伝子数 (i) M: サンプル分解を用いた教数 (j) K: 臓器数 (k) xijk: 遺伝子 例
  4. SIGBIO64 6 i:genes ul1i tDEG: tissue specific Differentially Expressed Genes

    臓器特異的な発現に発現差のある遺伝子がある変数選択法によ遺伝子 健常者 < 患者 tDEG: tDEG: 健常者 > 患者 とある変数選択法によ l1 が |G(l1l2l3)|最大である変数選択法によとする変数選択法によ If G(l1l2l3)>0 固定
  5. SIGBIO64 9 i:genes ul1i DEG: Differentially Expressed Genes 発現差のある遺伝子の統合解析ある変数選択法によ遺伝子 健常者

    < 患者 DEG: DEG: 健常者 > 患者 If G(l1l2l3)>0 遺伝子発現 とある変数選択法によ l1, l3 で |G(l1l2l3)|が最大の統合解析時 固定
  6. SIGBIO64 12 ## $mRNA ## [1] 150 サンプル分解を用いた教 ⨉ 200

    mRNAs ## ## $miRNA ## [1] 150 サンプル ⨉184 miRNAs ## ## $proteomics ## [1] 150 サンプル ⨉142 プロテイン 3種類の培養細胞の統合解析培養細胞 ## Basal Her2 LumA ## 45 30 75 bioconductorの統合解析mixOmics packageの統合解析例を用いた教師無し使う。 う。 https://bioconductor.org/packages/release/bioc/html/ mixOmics.html
  7. SIGBIO64 13 x ij :j番目のサンプルののサンプルのサンプルのサンプルのi番目のサンプルののサンプルのmRNA のサンプルの発現量 x kj :j番目のサンプルののサンプルのサンプルのサンプルのk番目のサンプルののサンプルのmiRNAのサンプルの発現量 x

    pj :j番目のサンプルののサンプルのサンプルのサンプルのp番目のサンプルののサンプルのタンパクの発現量のサンプルの発現量 テンソル:x ikpj =x ij・x kj・x pj テンソル分解を適用を適用適用 x ikpj ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 ∑ l 4 =1 L 4 G (l 1 l 2 l 3 l 4 )u l 1 i u l 2 k u l 3 p u l 4 j ul1i: mRNA, ul2k: miRNA ul3p: プロテオームの統合解析, ul4j: サンプル分解を用いた教
  8. SIGBIO64 14 u 1j u 4j Basal Her2 LumA Basal

    42 42 4 0 Her2 2 25 25 2 LumA 1 1 73 73 予想 現実 誤差 6.5% 線形判別 LOOCV
  9. SIGBIO64 20 テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師な発現し学習による変数学習による変数選択による変数選択法によ変数選択 の統合解析利点と欠点と欠点と欠点 利点と欠点 利点と欠点: : 高速(最適化し学習による変数な発現いから) ロバス解析ト (ラベル分解を用いた教情報フリー)

    教師な発現し学習による変数 (モデル分解を用いた教設計不要) 欠点と欠点:行:培養細胞、 欠点と欠点:行:培養細胞、 うまく行かなかったら行かな発現かった教師無し学習にらおわり メモリーを用いた教師無し食う。う。 150 ⨉ (200+184+142) vs 150 ⨉ 200 ⨉ 184 ⨉ 142