Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テンソル分解を用いた教師無し学習による変数選択法を用いたCOVID-19治療薬の探索

Y-h. Taguchi
November 24, 2020

 テンソル分解を用いた教師無し学習による変数選択法を用いたCOVID-19治療薬の探索

IBIS2020
テンソル分解を用いた教師無し学習による変数選択法を用いたCOVID-19治療薬の探索 (田口 善弘, Turki Turki)
IBIS2020
2020年11月25日
http://ibisml.org/ibis2020/ippan/
講演動画はこちら
https://youtu.be/LADVNDPB4x4

Y-h. Taguchi

November 24, 2020
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. IBIS2020 1 発表番号:6 発表番号:6 中央大学物理学科 田口善弘 中央大学物理学科 田口善弘 Turki Turki, Turki Turki,

    King Abdulaziz University King Abdulaziz University テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法を用変数選択法を用いたを用いた教師無し用いた教師無し学いた教師無し学習に テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法を用変数選択法を用いたを用いた教師無し用いた教師無し学いた教師無し学習に COVID-19 COVID-19治療薬の探索の探索探索 治療薬の探索の探索探索 概要: 概要: SARS-CoV-2 SARS-CoV-2を用いた教師無し感染させた複数の培させた教師無し学習に複数の探索培養細胞の遺伝子発現プの探索遺伝子発現プロプロ を用いた教師無し感染させた複数の培させた教師無し学習に複数の探索培養細胞の遺伝子発現プの探索遺伝子発現プロプロ ファイル分解を用いた教を用いた教師無しテンソル分解を用いた教とし学習による変数てテンソル分解をテンソル分解を用いた教分解を用いた教師無を用いた教師無し適用いた教師無し学し学習による変数、得られた特異値得られた特異値られた教師無し学習に特異値 ファイル分解を用いた教を用いた教師無しテンソル分解を用いた教とし学習による変数てテンソル分解をテンソル分解を用いた教分解を用いた教師無を用いた教師無し適用いた教師無し学し学習による変数、得られた特異値得られた特異値られた教師無し学習に特異値 ベクトル分解を用いた教の探索遺伝子ごとの探索値がガウス分布であガウス分布であるとい分布であるという帰である変数選択法を用という帰無仮説を帰無し学習による変仮説をを用いた教師無し ベクトル分解を用いた教の探索遺伝子ごとの探索値がガウス分布であガウス分布であるとい分布であるという帰である変数選択法を用という帰無仮説を帰無し学習による変仮説をを用いた教師無し 使って補正ってテンソル分解を補正 使って補正ってテンソル分解を補正P P値がガウス分布であ0.01以下であるとい以下であるという条である変数選択法を用という帰無仮説を条件で遺伝子をスクで遺伝子を用いた教師無しス分布であるといク 値がガウス分布であ0.01以下であるとい以下であるという条である変数選択法を用という帰無仮説を条件で遺伝子をスクで遺伝子を用いた教師無しス分布であるといク リーニングすることで、感する変数選択法を用ことで、得られた特異値感染させた複数の培に関係する遺伝子が同する変数選択法を用遺伝子がガウス分布であ同定できると同できる変数選択法を用と同 リーニングすることで、感する変数選択法を用ことで、得られた特異値感染させた複数の培に関係する遺伝子が同する変数選択法を用遺伝子がガウス分布であ同定できると同できる変数選択法を用と同 時にこれらを標的にこれらを用いた教師無し標的とする既知化合とする変数選択法を用既知化合物がガウス分布であ有効な治療薬候補にな治療薬候補にな治療薬の探索候補にな治療薬候補になる変数選択法を用 時にこれらを標的にこれらを用いた教師無し標的とする既知化合とする変数選択法を用既知化合物がガウス分布であ有効な治療薬候補にな治療薬候補にな治療薬の探索候補にな治療薬候補になる変数選択法を用 ことを用いた教師無し示した。伝統的なし学習による変数た教師無し学習に。伝統的な2群の伝統的とする既知化合な治療薬候補にな2群の両側統計検群の両側統計検定の探索両側統計検定できると同を用いた教師無し用いた教師無し学いた教師無し学習にス分布であるといクリーニ ことを用いた教師無し示した。伝統的なし学習による変数た教師無し学習に。伝統的な2群の伝統的とする既知化合な治療薬候補にな2群の両側統計検群の両側統計検定の探索両側統計検定できると同を用いた教師無し用いた教師無し学いた教師無し学習にス分布であるといクリーニ ングすることで、感では多すぎたり少な多すぎたり少なすすぎた教師無し学習にり少なすぎたりの少なすぎたりの遺な治療薬候補になすぎた教師無し学習にり少なすぎたりのの探索遺伝子がガウス分布であ選ばれてテンソル分解をし学習による変数まい、得られた特異値そ ングすることで、感では多すぎたり少な多すぎたり少なすすぎた教師無し学習にり少なすぎたりの少なすぎたりの遺な治療薬候補になすぎた教師無し学習にり少なすぎたりのの探索遺伝子がガウス分布であ選ばれてテンソル分解をし学習による変数まい、得られた特異値そ そもそもス分布であるといクリーニングすることで、感がガウス分布であ難しいデータであし学習による変数いデータであることが解である変数選択法を用ことがガウス分布であ解を用いた教師無った教師無し学習に。伝統的な2群の そもそもス分布であるといクリーニングすることで、感がガウス分布であ難しいデータであし学習による変数いデータであることが解である変数選択法を用ことがガウス分布であ解を用いた教師無った教師無し学習に。伝統的な2群の
  2. IBIS2020 3 Invited talk Invited talk:7th Annual Congress of the

    European Society for Translational Medicine on Covid-19 (EUSTM-2020) 21-25 September, 2020 (Virtual Congress)
  3. IBIS2020 4 x ijk G u l1i u l2j u

    l3k L1 L2 L3 HOSVD (Higher Order Singular Value Decomposition) テンソル分解を用いた教 N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k N: 遺伝子数 (i) M: サンプル分解を用いた教数 (j) K: 臓器数 (k) xijk: 遺伝子 例
  4. IBIS2020 6 i:genes ul1i tDEG: tissue specific Differentially Expressed Genes

    臓器特異的とする既知化合に発現プロ差がある遺伝子がガウス分布であある変数選択法を用遺伝子 健常者 < 患者 tDEG: tDEG: 健常者 > 患者 とある変数選択法を用 l1 がガウス分布であ |G(l1l2l3)|最大である変数選択法を用とする変数選択法を用 If G(l1l2l3)>0 固定できると同
  5. IBIS2020 8 x i jk m ∈ℝ21797×5×2×3 データセット GSE147507 3種類の肺がんの培養の肺がんの培養細肺がんの培養細胞がんの肺がんの培養細培養細胞ににSARS-CoV-2を感染させた。感染させた。させた。 i:遺伝子(21797)

    j: j=1:Calu3, j=2: NHBE, j=3:A549 MOI:0.2, j=4: A549 MOI 2.0, j=5:A549 ACE2 expressed (MOI:Multiplicity of infection) k: k=1: Mock, k=2:SARS-CoV-2 infected m: three biological replicates
  6. IBIS2020 9 x i jk m ≃∑ l 1 =1

    L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 ∑ l 4 =1 L 4 G(l 1 l 2 l 3 l 4 )u l 1 j u l 2 k u l 3 m u l 4 i u l1j : l 1 種類の肺がんの培養目の培養細胞依存の肺がんの培養細培養細胞に依存性 u l2k : l 2 種類の肺がんの培養目の培養細胞依存の肺がんの培養細SARS-CoV-2感染させた。有無依存性 u l3m : l 3 種類の肺がんの培養目の培養細胞依存の肺がんの培養細biological replicate 依存性 u l4i : l 4 種類の肺がんの培養目の培養細胞依存の肺がんの培養細遺伝子依存性 G: 各項の重みの肺がんの培養細重みみ 目的とする既知化合:培養細胞の遺伝子発現プの探索種類ややbiological replicateに 依らない(らな治療薬候補にない(u l1j やu l3m は多すぎたり少なj,mに依らない(らず一定値)一定できると同値) がガウス分布であ、得られた特異値SARS-CoV-2感染させた複数の培の探索有無し学習による変で変わる変数選択法を用 (u l21 =-u l22 )にな治療薬候補になる変数選択法を用よう帰無仮説をな治療薬候補になl 1 ,l 2 ,l 3 を感染させた。選びたいびたい
  7. IBIS2020 10 l 1 =1 l 2 =2 l 3

    =1 培養細胞に SARS-CoV-2 感染させた。有無 biological replicate 培養細胞の遺伝子発現プの探索種類やや biological replicateに依らない(ら な治療薬候補にないがガウス分布であ、得られた特異値SARS-CoV-2感 染させた複数の培の探索有無し学習による変で変わる変数選択法を用
  8. IBIS2020 11 l 1 =1 l 2 =2 l 3

    =1 培養細胞の遺伝子発現プの探索種類ややbiological replicateに依らない(らな治療薬候補にな いがガウス分布であ、得られた特異値SARS-CoV-2感染させた複数の培の探索有無し学習による変で変わる変数選択法を用よう帰無仮説をな治療薬候補にな 発現プロプロファイル分解を用いた教を用いた教師無し実現プロし学習による変数てテンソル分解をいる変数選択法を用遺伝子の探索発現プロ パタであることが解ーンは多すぎたり少なu 5i (l 4 =5) の肺がんの培養細時|G|が大きいきいl 4 は?
  9. IBIS2020 12 u 5iがガウス分布していると分布しているというしているという帰無仮説の元に帰無仮説の元に、遺伝子の肺がんの培養細元に、遺伝子に、遺伝子遺伝子iにχ二乗 分布しているというを感染させた。仮定してしてP値を付与、多重比を感染させた。付与、遺伝子多重み比較補正(BH法)して0.01以して0.01以下以下 の肺がんの培養細163遺伝子を感染させた。選びたいんだ ABCC3 ACE2 ACTB ACTG1

    ACTN4 AHNAK AKAP12 AKR1B1 AKR1B10 AKR1C2 ALDH1A1 ALDH3A1 ALDOA AMIGO2 ANTXR1 ANXA2 ASNS ASPH ATF4 ATP1B1 C3 CALM2 CALR CD24 CFL1 CPLX2 CRIM1 CTGF CXCL5 CYP24A1 DCBLD2 DDIT4 DHCR24 EEF1A1 EEF2 EIF1 EIF4B EIF5A ENO1 ERBB2 EREG FADS2 FASN FDCSP FDPS FLNB FTH1 FTL G6PD GAPDH GAS5 GPX2 GSTP1 H1F0 HMGA1 HNRNPA2B1 HSP90AA1 HSP90AB1 HSPA8 ICAM1 IER3 IFIT2 IGFBP3 IGFBP4 ITGA2 ITGA3 ITGAV ITGB1 JUN KRT18 KRT19 KRT23 KRT5 KRT6A KRT7 KRT8 KRT81 LAMB3 LAMC2 LCN2 LDHA LIF LOXL2 MIEN1 MTHFD2 MYL6 NAMPT NAP1L1 NEAT1 NFKBIA NPM1 NQO1 OAS2 P4HB PABPC1 PFN1 PGK1 PKM PLAU PLOD2 PMEPA1 PPIA PPP1R15A PSAT1 PSMD3 PTMA RAI14 RNF213 RPL10 RPL12 RPL23 RPL26 RPL28 RPL3 RPL37 RPL4 RPL5 RPL7 RPL7A RPL9 RPS19 RPS20 RPS24 RPS27 RPS27A RPS3A RPS4X RPS6 S100A2 S100A6 SAT1 SCD SERPINA3 SERPINE1 SLC38A2 SLC7A11 SLC7A5 SPP1 SPTBN1 SQSTM1 STARD3 STAT1 STC2 TGFBI TGM2 TIPARP TMSB4X TNFAIP2 TOP2A TPI1 TPM1 TPT1 TRAM1 TUBA1B TUBB TUBB4B TXNIP TXNRD1 UBC VEGFA VIM YBX1 YWHAZ
  10. IBIS2020 16 Term Overlap P-value Adjusted P-value Ivermectin-7.5 mg/kg in

    CMC-Rat-Liver-1d-dn 12/277 2.98E-06 9.93E-06 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-5d-dn 12/289 4.60E-06 1.44E-05 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-3d-dn 11/285 2.29E-05 5.56E-05 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-1d-up 10/323 3.28E-04 5.39E-04 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-5d-up 8/311 4.06E-03 5.10E-03 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-3d-up 8/315 4.38E-03 5.46E-03 イベルメクチンもヒットしておもヒットしておりヒットしております! DrugMatrix in Enrichr Enrichr