Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テンソル分解を用いた教師無し学習による変数選択法を用いたトランスオミクス解析

 テンソル分解を用いた教師無し学習による変数選択法を用いたトランスオミクス解析

Y-h. Taguchi

May 28, 2020
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 1 テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法を用変数選択法を用いたを用いた教師無し用いた教師無し学いた教師無し学習に トランスオミクス解を用いた教師無析 中央大学・理工学部・物理学科・田口善弘 代謝統合オミクス第4回オミクス第4回領域会議 5/28(木) 15:35−15:47

  2. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 2 Springerから英語の単著で解英語の単著で解説書の単著で解説書を単著で解説書を出しで解説書を出しま解説書を出しましを出しまし出しまししまし たの単著で解説書をで解説書を出しま買って頂けると嬉って頂けると嬉しい頂けると嬉しいでけると嬉しいです。と嬉しいです。とてしいで解説書を出します。と嬉しいです。とて頂けると嬉しいも高高 いの単著で解説書をで解説書を出しま研究費での購入をお勧で解説書を出しまの単著で解説書を購入をお勧めしますを出しましお勧めします。勧めします。めします。 宣伝[1/2] 宣伝[1/2]

  3. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 3 ブル分解を用いた教ーバックス発売中! 宣伝[2/2] 宣伝[2/2]

  4. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 4 テンソル分解を用いた教とは? テンソル分解を用いた教とは?:行列の拡大版。の拡大版。拡大版。 行列の拡大版。:遺伝子i×ヒトj(患者vs健常者):xij テンソル分解を用いた教:遺伝子i×ヒトj(患者vs健常者)×臓器k: xijk 主成分分析・テンソル分解を用いた教分解を用いた教師無とは? 主成分分析・テンソル分解を用いた教分解を用いた教師無とは? 行列の拡大版。やテンソルをベクテンソル分解を用いた教を用いた教師無しベクトル分解を用いた教の拡大版。積に分解する。に分解を用いた教師無する変数選択法を用。

    N×M N M × 遺伝子i 遺伝子i ヒトj = ヒトj ヒトj 遺伝子i 臓 器 k ヒトj N M × 遺伝子i ヒトj = × M 臓 器 k ベクトル分解を用いた教に分解を用いた教師無す る変数選択法を用 こ と で 、 「遺伝 遺 伝 子」「遺伝ヒト」「遺伝臓器」 別のベクトルを得の拡大版。ベクトル分解を用いた教を用いた教師無し得 て「遺伝意味 意味」を用いた教師無し解を用いた教師無釈 できる変数選択法を用。 実際には一組のには一組のの拡大版。 ベクトル分解を用いた教で表現はは できないの拡大版。でベク トル分解を用いた教の拡大版。積に分解する。の拡大版。組のを用いた教師無し多 数加え合わせる。え合わせる。合オミクス第4回わせる変数選択法を用。
  5. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 5 x ijk G u l1i u l2j u

    l3k L1 L2 L3 HOSVD (Higher Order Singular Value Decomposition) テンソル分解を用いた教に拡張….. N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k N: 遺伝子数 (i) M: サンプル分解を用いた教数 (j) K: 臓器数 (k) xijk: 遺伝子 例
  6. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 6 その拡大版。意味は….. j:ヒト 健常者 患者 ul2j と嬉しいです。とある l2 で解説書を出しま

    と嬉しいです。とある l3 で解説書を出しま k:臓器 臓器特異的な発現な発現は ul3k
  7. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 7 i:遺伝子 ul1i tDEG: tissue specific Differentially Expressed Genes

    臓器特異的な発現に患者と健常者に発現は差がある遺伝子がある変数選択法を用遺伝子 健常者 < 患者 tDEG: tDEG: 健常者 > 患者 とある変数選択法を用 l1 が最大の拡大版。 |G(l1l2l3)|を用いた教師無し持つ時つ時時 If G(l1l2l3)>0 固定
  8. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 8 SRAS-CoV-2の拡大版。Drug repurposingを用いた教師無しやテンソルをベクってみた教師無し学習に。 (既存の抗ウィルス薬の拡大版。抗ウィルス薬のうウィル分解を用いた教ス薬のうち、の拡大版。うち、SARS-CoV-2に効きそうなものをきそうなもの拡大版。を用いた教師無し推定)

  9. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 9 x i jk m ∈ℝ21797×5×2×3 データセット GSE147507 3種類の肺がんの培養の拡大版。肺がんの培養細胞がんの拡大版。培養細胞ににSARS-CoV-2を用いた教師無し感染させた。させた教師無し学習に。 i:遺伝子(21797)

    j: j=1:Calu3, j=2: NHBE, j=3:A549 MOI:0.2, j=4: A549 MOI 2.0, j=5:A549 ACE2 expressed (MOI:Multiplicity of infection) k: k=1: Mock, k=2:SARS-CoV-2 infected m: three biological replicates
  10. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 10 x i jk m ≃∑ l 1 =1

    L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 ∑ l 4 =1 L 4 G(l 1 l 2 l 3 l 4 )u l 1 j u l 2 k u l 3 m u l 4 i u l1j : l 1 種類の肺がんの培養目の培養細胞依存の拡大版。培養細胞に依存の抗ウィルス薬性 u l2k : l 2 種類の肺がんの培養目の培養細胞依存の拡大版。SARS-CoV-2感染させた。有無し学習による変依存の抗ウィルス薬性 u l3m : l 3 種類の肺がんの培養目の培養細胞依存の拡大版。biological replicate 依存の抗ウィルス薬性 u l4i : l 4 種類の肺がんの培養目の培養細胞依存の拡大版。遺伝子依存の抗ウィルス薬性 G: 各項の重みの拡大版。重みみ 目の培養細胞依存的な発現:培養細胞にの拡大版。種類の肺がんの培養やテンソルをベクbiological replicateに 依らない(u l1j やテンソルをベクu l3m はj,mに依らず一定値)一定値) が、SARS-CoV-2感染させた。の拡大版。有無し学習による変で変わる変数選択法を用 (u l21 =-u l22 )になる変数選択法を用ようなl 1 ,l 2 ,l 3 を用いた教師無し選びた教師無し学習にい
  11. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 11 l 1 =1 l 2 =2 l 3

    =1 培養細胞に SARS-CoV-2感染させた。有無し学習による変 biological replicate 培養細胞にの拡大版。種類の肺がんの培養やテンソルをベク biological replicateに依ら ないが、SARS-CoV-2感 染させた。の拡大版。有無し学習による変で変わる変数選択法を用
  12. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 12 l 1 =1 l 2 =2 l 3

    =1 培養細胞にの拡大版。種類の肺がんの培養やテンソルをベクbiological replicateに依らな いが、SARS-CoV-2感染させた。の拡大版。有無し学習による変で変わる変数選択法を用ような 発現はプロファイル分解を用いた教を用いた教師無し実現はし学習による変数ている変数選択法を用遺伝子の拡大版。発現は パターンはu 5i (l 4 =5) の拡大版。時|G|が大きいl 4 は?
  13. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 13 u 5iがガウス分布しているというし学習による変数ている変数選択法を用という帰無し学習による変仮説の元に、遺伝子の拡大版。元に、遺伝子に、遺伝子iにχ二 乗分布しているというを用いた教師無し仮定し学習による変数てP値を用いた教師無し付与、多重み比較補正(BH法を用いた)し学習による変数て0.01 以下のの拡大版。163 163遺伝子を用いた教師無し選んだ ABCC3 ACE2 ACTB

    ACTG1 ACTN4 AHNAK AKAP12 AKR1B1 AKR1B10 AKR1C2 ALDH1A1 ALDH3A1 ALDOA AMIGO2 ANTXR1 ANXA2 ASNS ASPH ATF4 ATP1B1 C3 CALM2 CALR CD24 CFL1 CPLX2 CRIM1 CTGF CXCL5 CYP24A1 DCBLD2 DDIT4 DHCR24 EEF1A1 EEF2 EIF1 EIF4B EIF5A ENO1 ERBB2 EREG FADS2 FASN FDCSP FDPS FLNB FTH1 FTL G6PD GAPDH GAS5 GPX2 GSTP1 H1F0 HMGA1 HNRNPA2B1 HSP90AA1 HSP90AB1 HSPA8 ICAM1 IER3 IFIT2 IGFBP3 IGFBP4 ITGA2 ITGA3 ITGAV ITGB1 JUN KRT18 KRT19 KRT23 KRT5 KRT6A KRT7 KRT8 KRT81 LAMB3 LAMC2 LCN2 LDHA LIF LOXL2 MIEN1 MTHFD2 MYL6 NAMPT NAP1L1 NEAT1 NFKBIA NPM1 NQO1 OAS2 P4HB PABPC1 PFN1 PGK1 PKM PLAU PLOD2 PMEPA1 PPIA PPP1R15A PSAT1 PSMD3 PTMA RAI14 RNF213 RPL10 RPL12 RPL23 RPL26 RPL28 RPL3 RPL37 RPL4 RPL5 RPL7 RPL7A RPL9 RPS19 RPS20 RPS24 RPS27 RPS27A RPS3A RPS4X RPS6 S100A2 S100A6 SAT1 SCD SERPINA3 SERPINE1 SLC38A2 SLC7A11 SLC7A5 SPP1 SPTBN1 SQSTM1 STARD3 STAT1 STC2 TGFBI TGM2 TIPARP TMSB4X TNFAIP2 TOP2A TPI1 TPM1 TPT1 TRAM1 TUBA1B TUBB TUBB4B TXNIP TXNRD1 UBC VEGFA VIM YBX1 YWHAZ
  14. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 14 SARSーCoVと相互作用いた教師無し学する変数選択法を用既知のヒト遺伝子がの拡大版。ヒト遺伝子が多数ヒット

  15. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 15 SARSーCoV、SARS-Batの拡大版。感染させた。で発現はが変化することが知らする変数選択法を用ことが知のヒト遺伝子がられて いる変数選択法を用遺伝子が多数ヒット UP DOWN

  16. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 16 SARS-CoV-2の拡大版。感染させた。時に重み要なヒト遺伝子をなヒト遺伝子を用いた教師無し特定で きた教師無し学習にようである変数選択法を用。 ↓ これらの拡大版。遺伝子の拡大版。発現はに影響を与える薬を探を用いた教師無し与え合わせる。る変数選択法を用薬のうち、を用いた教師無し探せば、せば、 リポジショニング候補薬がみつか候補薬のうち、がみつ時かる変数選択法を用はず一定値) ↓ 薬のうち、ごとにどんな遺伝子が影響を与える薬を探を用いた教師無しうける変数選択法を用かの拡大版。 データベース(Enrichrの拡大版。一部)と比較

  17. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 17 Gene expression omnibusから集めた薬剤投与でめた教師無し学習に薬のうち、剤投与で発現は変化することが知ら する変数選択法を用薬のうち、との拡大版。比較

  18. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 18 DrugMatrixから集めた薬剤投与でめた教師無し学習に薬のうち、剤投与で発現は変化することが知らする変数選択法を用薬のうち、との拡大版。比較 ヒット化することが知ら合オミクス第4回物には多数の拡大版。既知のヒト遺伝子がの拡大版。抗ウィルス薬のうウィル分解を用いた教ス薬のうち、が含まれてまれて ヒット化することが知ら合オミクス第4回物には多数の拡大版。既知のヒト遺伝子がの拡大版。抗ウィルス薬のうウィル分解を用いた教ス薬のうち、が含まれてまれて いた教師無し学習にの拡大版。でこれらを用いた教師無し網羅的な発現にテストすれば いた教師無し学習にの拡大版。でこれらを用いた教師無し網羅的な発現にテストすればSARS-CoV-2 SARS-CoV-2の拡大版。 の拡大版。 抗ウィルス薬のうウィル分解を用いた教ス剤が見つかる可能性がつ時かる変数選択法を用可能性がある変数選択法を用。

    抗ウィルス薬のうウィル分解を用いた教ス剤が見つかる可能性がつ時かる変数選択法を用可能性がある変数選択法を用。 C646, Chelerythrine chloride, Canertinib BX-795, Sorafenib, QL-X-138, Radicicol,A-443654,CGP-60474, Alvocidib, QL-XII-47, Mitoxantrone, Geldanamycin, LINCS1000で多数の拡大版。ヒット
  19. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 19 Term Overlap P-value Adjusted P-value Ivermectin-7.5 mg/kg in

    CMC-Rat-Liver-1d-dn 12/277 2.98E-06 9.93E-06 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-5d-dn 12/289 4.60E-06 1.44E-05 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-3d-dn 11/285 2.29E-05 5.56E-05 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-1d-up 10/323 3.28E-04 5.39E-04 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-5d-up 8/311 4.06E-03 5.10E-03 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-3d-up 8/315 4.38E-03 5.46E-03 イベル分解を用いた教メクチンもヒットし学習による変数ております! DrugMatrix in Enrichr Enrichr
  20. 代謝統合オミクス第4回オミクス第4回領域会議第4回領域会議 20 まとめ テンソル分解を用いた教分解を用いた教師無は条件が複数(今の場が複数(今の場合は、培の拡大版。場合オミクス第4回は、培 養細胞にの拡大版。種類の肺がんの培養とSARS-CoV-2の拡大版。感染させた。有無し学習による変)を用いた教師無し 統合オミクス第4回的な発現に解を用いた教師無析し学習による変数て共通に変化する遺伝に変化することが知らする変数選択法を用遺伝子を用いた教師無し探せば、 す能力に長けておりこに長けておりこれがけておりこれがリポジショニング候補薬がみつかに 有効きそうなものをである変数選択法を用と考えられた。え合わせる。られた教師無し学習に。