Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テンソル分解に基づく教師なし特徴抽出による新型コロナウイルス(SARS-CoV-2)に対する新...

Y-h. Taguchi
November 26, 2022

テンソル分解に基づく教師なし特徴抽出による新型コロナウイルス(SARS-CoV-2)に対する新しい先進的in silico創薬手法の提案

SIGBIO72
http://www.ipsj.or.jp/kenkyukai/event/bio72.html

2022年11月29日(火)

Y-h. Taguchi

November 26, 2022
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. SIGBIO72 1 テンソル分解に基づく教分解に基づく教師なに基づく教師なし基づく教師なし特づく教師なし特徴抽教師なし特徴抽出になし特徴抽出による特徴抽出による新型コロに基づく教師なしよる新型コロナウイ新型コロナウイルスコロナウイル分解に基づく教ス テンソル分解に基づく教分解に基づく教師なに基づく教師なし基づく教師なし特づく教師なし特徴抽教師なし特徴抽出になし特徴抽出による特徴抽出による新型コロに基づく教師なしよる新型コロナウイ新型コロナウイルスコロナウイル分解に基づく教ス ( (SARS-CoV-2 SARS-CoV-2)に対する新しいに基づく教師なし対する新しい先進する新型コロナウイ新し特徴抽出によるい先進的先進的 )に対する新しいに基づく教師なし対する新しい先進する新型コロナウイ新し特徴抽出によるい先進的先進的in silico in

    silico創薬手法の提案の提案提案 創薬手法の提案の提案提案 中央大学物理学科 田口善弘 中央大学物理学科 田口善弘 Turki Turki, Turki Turki, King Abdulaziz University King Abdulaziz University 概要: 概要: SARS-CoV-2 SARS-CoV-2を感染させた複数感染させた複数の培させた複数の培養細胞複数の培養細胞の遺の提案培養細胞の遺伝子発現プの提案遺伝子発現プロファプロファ を感染させた複数感染させた複数の培させた複数の培養細胞複数の培養細胞の遺の提案培養細胞の遺伝子発現プの提案遺伝子発現プロファプロファ イル分解に基づく教を感染させた複数テンソル分解に基づく教とし特徴抽出によるてテンソル分解をテンソル分解に基づく教分解に基づく教師なを感染させた複数適用し、得られた特し特徴抽出による、得られた特異値得られた特異値ベられた複数の培養細胞特異値ベクトベクト イル分解に基づく教を感染させた複数テンソル分解に基づく教とし特徴抽出によるてテンソル分解をテンソル分解に基づく教分解に基づく教師なを感染させた複数適用し、得られた特し特徴抽出による、得られた特異値得られた特異値ベられた複数の培養細胞特異値ベクトベクト ル分解に基づく教の提案遺伝子ごとの提案値ベクトがガウス分布であガウス分布であるという帰である新型コロナウイとい先進的う帰無仮説を使っ帰無仮説を使ってを感染させた複数使ってってテンソル分解を ル分解に基づく教の提案遺伝子ごとの提案値ベクトがガウス分布であガウス分布であるという帰である新型コロナウイとい先進的う帰無仮説を使っ帰無仮説を使ってを感染させた複数使ってってテンソル分解を 補正 補正P P値ベクトがガウス分布であ0.01以下であるとい以下であるという条である新型コロナウイとい先進的う帰無仮説を使っ条件で遺伝子をスクで遺伝子を感染させた複数スクリーニング 値ベクトがガウス分布であ0.01以下であるとい以下であるという条である新型コロナウイとい先進的う帰無仮説を使っ条件で遺伝子をスクで遺伝子を感染させた複数スクリーニング する新型コロナウイことで、得られた特異値感染させた複数の培に基づく教師なし関係する遺伝子が同する新型コロナウイ遺伝子がガウス分布であ同定できると同時にできる新型コロナウイと同時にこれらをに基づく教師なしこれらを感染させた複数 する新型コロナウイことで、得られた特異値感染させた複数の培に基づく教師なし関係する遺伝子が同する新型コロナウイ遺伝子がガウス分布であ同定できると同時にできる新型コロナウイと同時にこれらをに基づく教師なしこれらを感染させた複数 標的とする新型コロナウイ既知化合物がガウス分布であ有効な治療薬候補にな治療薬候補に基づく教師なしなる新型コロナウイことを感染させた複数示した。し特徴抽出によるた複数の培養細胞。 標的とする新型コロナウイ既知化合物がガウス分布であ有効な治療薬候補にな治療薬候補に基づく教師なしなる新型コロナウイことを感染させた複数示した。し特徴抽出によるた複数の培養細胞。 伝統的な2群の両側統計検群の両側統計検定の提案両側統計検定できると同時にを感染させた複数用し、得られた特い先進的た複数の培養細胞スクリーニングでは多すぎ多すぎすぎ 伝統的な2群の両側統計検群の両側統計検定の提案両側統計検定できると同時にを感染させた複数用し、得られた特い先進的た複数の培養細胞スクリーニングでは多すぎ多すぎすぎ た複数の培養細胞り少なすぎたりの少なすぎたりの遺なすぎた複数の培養細胞り少なすぎたりのの提案遺伝子がガウス分布であ選ばれてしまい、ばれてテンソル分解をし特徴抽出によるまい先進的、得られた特異値そそもそもスクリーニ た複数の培養細胞り少なすぎたりの少なすぎたりの遺なすぎた複数の培養細胞り少なすぎたりのの提案遺伝子がガウス分布であ選ばれてしまい、ばれてテンソル分解をし特徴抽出によるまい先進的、得られた特異値そそもそもスクリーニ ングがガウス分布であ難しいデータであし特徴抽出によるい先進的データであることが解である新型コロナウイことがガウス分布であ解に基づく教師なった複数の培養細胞。 ングがガウス分布であ難しいデータであし特徴抽出によるい先進的データであることが解である新型コロナウイことがガウス分布であ解に基づく教師なった複数の培養細胞。
  2. SIGBIO72 3 Invited talk Invited talk:7th Annual Congress of the

    European Society for Translational Medicine on Covid-19 (EUSTM-2020) 21-25 September, 2020 (Virtual Congress)
  3. SIGBIO72 4 MS ID#: BIORXIV/2020/054213MS TITLE: Novel Method for Detection

    of Genes With Altered Expression Caused by Coronavirus Infection and Screening of Candidate Drugs for SARS-CoV-2 Dear Y-h. Taguchi; We regret to inform you that your manuscript is inappropriate for bioRxiv. As an abundance of caution, bioRxiv is not currently posting predictions of drug/therapeutic efficacy/potential for treatment of COVID-19 that are based solely on in silico work, given concerns about drug availability and dangers to the general public. This manuscript should instead undergo rapid peer review at a journal before dissemination. This has been a difficult decision not arrived at lightly and we understand it may be disappointing, but we currently feel this is the most responsible course of action in these exceptional circumstances. Best regards, The bioRxiv team
  4. SIGBIO72 5 x ijk G u l1i u l2j u

    l3k L1 L2 L3 HOSVD (Higher Order Singular Value Decomposition) テンソル分解に基づく教 N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k N: 遺伝子数の培養細胞の遺 (i) M: サンプル分解に基づく教数の培養細胞の遺 (j) K: 臓器数の培養細胞の遺 (k) xijk: 遺伝子 例
  5. SIGBIO72 7 i:genes ul1i tDEG: tissue specific Differentially Expressed Genes

    臓器特異的に基づく教師なし発現プロファ差がある遺伝子がガウス分布であある新型コロナウイ遺伝子 健常者 < 患者 tDEG: tDEG: 健常者 > 患者 とある新型コロナウイ l1 がガウス分布であ |G(l1l2l3)|最大である新型コロナウイとする新型コロナウイ If G(l1l2l3)>0 固定できると同時に
  6. SIGBIO72 9 x i jk m ∈ℝ21797×5×2×3 データセット GSE147507 3種類の肺がんの培養の肺がんの培養細肺がんの培養細胞がんの肺がんの培養細培養細胞ににSARS-CoV-2を感染させた。感染させた。させた。 i:遺伝子(21797)

    j: j=1:Calu3, j=2: NHBE, j=3:A549 MOI:0.2, j=4: A549 MOI 2.0, j=5:A549 ACE2 expressed (MOI:Multiplicity of infection) k: k=1: Mock, k=2:SARS-CoV-2 infected m: three biological replicates
  7. SIGBIO72 10 x i jk m ≃∑ l 1 =1

    L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 ∑ l 4 =1 L 4 G(l 1 l 2 l 3 l 4 )u l 1 j u l 2 k u l 3 m u l 4 i u l1j : l 1 種類の肺がんの培養目の培養細胞依存の肺がんの培養細培養細胞に依存性 u l2k : l 2 種類の肺がんの培養目の培養細胞依存の肺がんの培養細SARS-CoV-2感染させた。有無依存性 u l3m : l 3 種類の肺がんの培養目の培養細胞依存の肺がんの培養細biological replicate 依存性 u l4i : l 4 種類の肺がんの培養目の培養細胞依存の肺がんの培養細遺伝子依存性 G: 各項の重みの肺がんの培養細重みみ 目的:培養細胞の遺伝子発現プの提案種類ややbiological replicateに基づく教師なし 依らない(らない先進的(u l1j やu l3m は多すぎj,mに基づく教師なし依らない(らず一定値)一定できると同時に値ベクト)に対する新しい がガウス分布であ、得られた特異値SARS-CoV-2感染させた複数の培の提案有無で変わるわる新型コロナウイ (u l21 =-u l22 )に対する新しいに基づく教師なしなる新型コロナウイよう帰無仮説を使っなl 1 ,l 2 ,l 3 を感染させた。選びたいびたい
  8. SIGBIO72 11 l 1 =1 l 2 =2 l 3

    =1 培養細胞に SARS-CoV-2 感染させた。有無 biological replicate 培養細胞の遺伝子発現プの提案種類やや biological replicateに基づく教師なし依らない(ら ない先進的がガウス分布であ、得られた特異値SARS-CoV-2感 染させた複数の培の提案有無で変わるわる新型コロナウイ
  9. SIGBIO72 12 l 1 =1 l 2 =2 l 3

    =1 培養細胞の遺伝子発現プの提案種類ややbiological replicateに基づく教師なし依らない(らな い先進的がガウス分布であ、得られた特異値SARS-CoV-2感染させた複数の培の提案有無で変わるわる新型コロナウイよう帰無仮説を使っな 発現プロファプロファイル分解に基づく教を感染させた複数実現プロファし特徴抽出によるてテンソル分解をい先進的る新型コロナウイ遺伝子の提案発現プロファ パタであることが解ーンは多すぎu 5i (l 4 =5) の肺がんの培養細時|G|が大きいきいl 4 は?
  10. SIGBIO72 13 u 5iがガウス分布していると分布しているというしているという帰無仮説の元に帰無仮説の元に、遺伝子の肺がんの培養細元に、遺伝子に、遺伝子遺伝子iにχ二乗 分布しているというを感染させた。仮定してしてP値を付与、多重比を感染させた。付与、遺伝子多重み比較補正(BH法)して0.01以して0.01以下以下 の肺がんの培養細163遺伝子を感染させた。選びたいんだ ABCC3 ACE2 ACTB ACTG1

    ACTN4 AHNAK AKAP12 AKR1B1 AKR1B10 AKR1C2 ALDH1A1 ALDH3A1 ALDOA AMIGO2 ANTXR1 ANXA2 ASNS ASPH ATF4 ATP1B1 C3 CALM2 CALR CD24 CFL1 CPLX2 CRIM1 CTGF CXCL5 CYP24A1 DCBLD2 DDIT4 DHCR24 EEF1A1 EEF2 EIF1 EIF4B EIF5A ENO1 ERBB2 EREG FADS2 FASN FDCSP FDPS FLNB FTH1 FTL G6PD GAPDH GAS5 GPX2 GSTP1 H1F0 HMGA1 HNRNPA2B1 HSP90AA1 HSP90AB1 HSPA8 ICAM1 IER3 IFIT2 IGFBP3 IGFBP4 ITGA2 ITGA3 ITGAV ITGB1 JUN KRT18 KRT19 KRT23 KRT5 KRT6A KRT7 KRT8 KRT81 LAMB3 LAMC2 LCN2 LDHA LIF LOXL2 MIEN1 MTHFD2 MYL6 NAMPT NAP1L1 NEAT1 NFKBIA NPM1 NQO1 OAS2 P4HB PABPC1 PFN1 PGK1 PKM PLAU PLOD2 PMEPA1 PPIA PPP1R15A PSAT1 PSMD3 PTMA RAI14 RNF213 RPL10 RPL12 RPL23 RPL26 RPL28 RPL3 RPL37 RPL4 RPL5 RPL7 RPL7A RPL9 RPS19 RPS20 RPS24 RPS27 RPS27A RPS3A RPS4X RPS6 S100A2 S100A6 SAT1 SCD SERPINA3 SERPINE1 SLC38A2 SLC7A11 SLC7A5 SPP1 SPTBN1 SQSTM1 STARD3 STAT1 STC2 TGFBI TGM2 TIPARP TMSB4X TNFAIP2 TOP2A TPI1 TPM1 TPT1 TRAM1 TUBA1B TUBB TUBB4B TXNIP TXNRD1 UBC VEGFA VIM YBX1 YWHAZ
  11. SIGBIO72 15 Genes whose expression altered by SARS infection Genes

    whose expression altered by SARS infection
  12. SIGBIO72 18 Drug repositioning Drug repositioning Meloxicam Meloxicam is known

    to exert cytotoxic and antiproliferative activities towards virus-transformed tumor cells, including myelocytomatosis virus and Rous sarcoma virus. Gentamicin Gentamicin is known to be a bactericidal antibiotic, it also exhibits antiviral activity Dibromochloromethane Dibromochloromethane was announced as a possible antiviral drug by the Agency forToxic Substances and Disease Registry
  13. SIGBIO72 21 Comparisons with conventional methods: Comparisons with conventional methods:

    Since we do not know how many genes should be selected. We employed SAM and limma, which are gene selection specific algorithm (adjusted P-values are used ). t test SAM limma P>0.01 P≦0.01 P>0.01 P≦0.01 P>0.01 P≦0.01 Calu3 21754 43 21797 0 335 3789 NHBE 21797 0 21797 0 342 3906 A549 MOI 0.2 21797 0 21797 0 319 4391 MOI 2.0 21472 325 21797 0 208 4169 ACE2 expressed 21796 1 21797 0 182 4245 Statistical test Statistical test
  14. SIGBIO72 22 Comparisons with DESeq2: Comparisons with DESeq2: DESeq2 P>0.01

    P≦0.01 Calu3 7278 16432 NHBE 23383 327 A549 MOI 0.2 7858 15852 MOI 2.0 16279 7431 ACE2 expressed 16201 7509 After the publication of our paper, we have found the paper[*] that originally studied this GEO data was published (when we have done this study, only GEO data set was provides and no papers were published). The paper includes DESeq2 results. It is similar to limma; it detected most of genes as DEGs whereas it identified limited number of DEGs for NHBE cell lines [*]Daniel Blanco-Melo et al, Cell, 2020; 181(5): 1036-1045.e9. doi: 10.1016/j.cell.2020.04.026. Imbalanced Host Response to SARS- CoV-2 Drives Development of COVID-19 Statistical test Statistical test