Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テンソル分解を用いた教師無し学習による変数選択法によるmiRNA/mRNA/プロテオームの統合解析

948966d9c690e72faba4fd76e1858c56?s=47 Y-h. Taguchi
December 06, 2020

 テンソル分解を用いた教師無し学習による変数選択法によるmiRNA/mRNA/プロテオームの統合解析

第64回バイオ情報学研究発表会
http://www.ipsj.or.jp/kenkyukai/event/bio64.html
における発表のプレゼンです

948966d9c690e72faba4fd76e1858c56?s=128

Y-h. Taguchi

December 06, 2020
Tweet

Transcript

  1. SIGBIO64 1 テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法によ変数選択法によるによる変数選択法によ miRNA/mRNA/プロテオームの統合解析の統合解析統合解を用いた教師無析 中央大学物理学科 田口善弘 第64回バイオ情報学研バイオ情報学研究会 https://doi.org/10.1007/978-3-030-26763-6_54 https://doi.org/10.1101/591867

  2. SIGBIO64 2 特異値分解を用いた教師無 xij N M (uli)T N L vlj

    L M ⨉ ≈ x ij ≃∑ l=1 L u li λl v l j L L ⨉ λl N: 遺伝子総数 (i) M: サンプル分解を用いた教数 (j) xij: 遺伝子発現 例
  3. SIGBIO64 3 解を用いた教師無釈….. j:サンプル 健常者 患者 vlj i:遺伝子 uli DEG:

    Differentially Expressed Genes 発現差のある遺伝子の統合解析ある変数選択法によ遺伝子 とある変数選択法によ l 健常者 < 患者 DEG: DEG: 健常者 > 患者
  4. SIGBIO64 4 x ijk G u l1i u l2j u

    l3k L1 L2 L3 HOSVD (Higher Order Singular Value Decomposition) テンソル分解を用いた教に拡張….. N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k N: 遺伝子数 (i) M: サンプル分解を用いた教数 (j) K: 臓器数 (k) xijk: 遺伝子 例
  5. SIGBIO64 5 解を用いた教師無釈….. j:サンプル 健常者 患者 ul2j とある変数選択法によ l2 とある変数選択法によ

    l3 k:臓器 臓器特異的な発現な発現発現 ul3k
  6. SIGBIO64 6 i:genes ul1i tDEG: tissue specific Differentially Expressed Genes

    臓器特異的な発現に発現差のある遺伝子がある変数選択法によ遺伝子 健常者 < 患者 tDEG: tDEG: 健常者 > 患者 とある変数選択法によ l1 が |G(l1l2l3)|最大である変数選択法によとする変数選択法によ If G(l1l2l3)>0 固定
  7. SIGBIO64 7 複数の統合解析行列またはテンソルまた教師無し学習にはテンソルの統合テンソル分解を用いた教の統合解析統合解を用いた教師無析 xij : サンプル分解を用いた教jの統合解析遺伝子iの統合解析発現量 xkj: サンプル分解を用いた教jの統合解析領域 kの統合解析メチル分解を用いた教化 x

    xijk ijk ≡ ≡ x xij ij ⨉ ⨉ x xkj kj G u l1i u l2j u l3k L1 L2 L3 x ijk N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k
  8. SIGBIO64 8 解を用いた教師無釈….. j:サンプル 健常者 患者 ul2j とある変数選択法によ l2

  9. SIGBIO64 9 i:genes ul1i DEG: Differentially Expressed Genes 発現差のある遺伝子の統合解析ある変数選択法によ遺伝子 健常者

    < 患者 DEG: DEG: 健常者 > 患者 If G(l1l2l3)>0 遺伝子発現 とある変数選択法によ l1, l3 で |G(l1l2l3)|が最大の統合解析時 固定
  10. SIGBIO64 10 k:regions ul3k DMR: Differentially Methylated Regions メチル分解を用いた教化に差のある遺伝子がある変数選択法によ領域 健常者

    < 患者 DMR: DMR: 健常者 > 患者 メチル分解を用いた教化
  11. SIGBIO64 11 マル分解を用いた教チオミックス解析解を用いた教師無析

  12. SIGBIO64 12 ## $mRNA ## [1] 150 サンプル分解を用いた教 ⨉ 200

    mRNAs ## ## $miRNA ## [1] 150 サンプル ⨉184 miRNAs ## ## $proteomics ## [1] 150 サンプル ⨉142 プロテイン 3種類の培養細胞の統合解析培養細胞 ## Basal Her2 LumA ## 45 30 75 bioconductorの統合解析mixOmics packageの統合解析例を用いた教師無し使う。 う。 https://bioconductor.org/packages/release/bioc/html/ mixOmics.html
  13. SIGBIO64 13 x ij :j番目のサンプルののサンプルのサンプルのサンプルのi番目のサンプルののサンプルのmRNA のサンプルの発現量 x kj :j番目のサンプルののサンプルのサンプルのサンプルのk番目のサンプルののサンプルのmiRNAのサンプルの発現量 x

    pj :j番目のサンプルののサンプルのサンプルのサンプルのp番目のサンプルののサンプルのタンパクの発現量のサンプルの発現量 テンソル:x ikpj =x ij・x kj・x pj テンソル分解を適用を適用適用 x ikpj ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 ∑ l 4 =1 L 4 G (l 1 l 2 l 3 l 4 )u l 1 i u l 2 k u l 3 p u l 4 j ul1i: mRNA, ul2k: miRNA ul3p: プロテオームの統合解析, ul4j: サンプル分解を用いた教
  14. SIGBIO64 14 u 1j u 4j Basal Her2 LumA Basal

    42 42 4 0 Her2 2 25 25 2 LumA 1 1 73 73 予想 現実 誤差 6.5% 線形判別 LOOCV
  15. SIGBIO64 15 絶対値の統合解析小さい順に さい順に に |G(l1,l2,l3,l4)| l4=1,4を用いた教師無し並べるべる変数選択法によ 1 ≦ l3

    ≦ 4, プロテオーム 1 ≦ l1 ≦ 2, mRNA 1 ≦ l2 ≦ 2, miRNA
  16. SIGBIO64 16 選択し学習による変数た教師無し学習に特異値ベクト ル分解を用いた教の統合解析2乗和が大きい順乗和が大きい順が大きい順に に10個の 個の の統合解析 mRNAsと miRNAs とタンパクを用いた教師無し選

    択。3つの統合解析培養細胞を用いた教師無し別 けられる変数選択法によかを用いた教師無し見た。た教師無し学習に。
  17. SIGBIO64 17 Basal Her2 LumA mRNA miRNA protein ヒートマップ:行:培養細胞、行:行:培養細胞、培養細胞、列またはテンソル:行:培養細胞、選択された教師無し学習に変数

  18. SIGBIO64 18 判別に使う。 用いた教師無し学し学習による変数た教師無し学習に生成変数の統合解析数 誤差のある遺伝子 0.05 0.10 0.15 DIABLOが生成し学習による変数た教師無し学習に変数での統合解析判別能力 DIABLO

    DIABLO と比較 と比較
  19. SIGBIO64 19 ヒートマップ:行:培養細胞、 行:行:培養細胞、培養細胞 列またはテンソル:行:培養細胞、選択された教師無し学習に変数

  20. SIGBIO64 20 テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師な発現し学習による変数学習による変数選択による変数選択法によ変数選択 の統合解析利点と欠点と欠点と欠点 利点と欠点 利点と欠点: : 高速(最適化し学習による変数な発現いから) ロバス解析ト (ラベル分解を用いた教情報フリー)

    教師な発現し学習による変数 (モデル分解を用いた教設計不要) 欠点と欠点:行:培養細胞、 欠点と欠点:行:培養細胞、 うまく行かなかったら行かな発現かった教師無し学習にらおわり メモリーを用いた教師無し食う。う。 150 ⨉ (200+184+142) vs 150 ⨉ 200 ⨉ 184 ⨉ 142