Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テンソル分解を用いた教師無し学習による変数選択法を用いたCOVID-19治療薬の探索

948966d9c690e72faba4fd76e1858c56?s=47 Y-h. Taguchi
November 24, 2020

 テンソル分解を用いた教師無し学習による変数選択法を用いたCOVID-19治療薬の探索

IBIS2020
テンソル分解を用いた教師無し学習による変数選択法を用いたCOVID-19治療薬の探索 (田口 善弘, Turki Turki)
IBIS2020
2020年11月25日
http://ibisml.org/ibis2020/ippan/
講演動画はこちら
https://youtu.be/LADVNDPB4x4

948966d9c690e72faba4fd76e1858c56?s=128

Y-h. Taguchi

November 24, 2020
Tweet

Transcript

  1. IBIS2020 1 発表番号:6 発表番号:6 中央大学物理学科 田口善弘 中央大学物理学科 田口善弘 Turki Turki, Turki Turki,

    King Abdulaziz University King Abdulaziz University テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法を用変数選択法を用いたを用いた教師無し用いた教師無し学いた教師無し学習に テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法を用変数選択法を用いたを用いた教師無し用いた教師無し学いた教師無し学習に COVID-19 COVID-19治療薬の探索の探索探索 治療薬の探索の探索探索 概要: 概要: SARS-CoV-2 SARS-CoV-2を用いた教師無し感染させた複数の培させた教師無し学習に複数の探索培養細胞の遺伝子発現プの探索遺伝子発現プロプロ を用いた教師無し感染させた複数の培させた教師無し学習に複数の探索培養細胞の遺伝子発現プの探索遺伝子発現プロプロ ファイル分解を用いた教を用いた教師無しテンソル分解を用いた教とし学習による変数てテンソル分解をテンソル分解を用いた教分解を用いた教師無を用いた教師無し適用いた教師無し学し学習による変数、得られた特異値得られた特異値られた教師無し学習に特異値 ファイル分解を用いた教を用いた教師無しテンソル分解を用いた教とし学習による変数てテンソル分解をテンソル分解を用いた教分解を用いた教師無を用いた教師無し適用いた教師無し学し学習による変数、得られた特異値得られた特異値られた教師無し学習に特異値 ベクトル分解を用いた教の探索遺伝子ごとの探索値がガウス分布であガウス分布であるとい分布であるという帰である変数選択法を用という帰無仮説を帰無し学習による変仮説をを用いた教師無し ベクトル分解を用いた教の探索遺伝子ごとの探索値がガウス分布であガウス分布であるとい分布であるという帰である変数選択法を用という帰無仮説を帰無し学習による変仮説をを用いた教師無し 使って補正ってテンソル分解を補正 使って補正ってテンソル分解を補正P P値がガウス分布であ0.01以下であるとい以下であるという条である変数選択法を用という帰無仮説を条件で遺伝子をスクで遺伝子を用いた教師無しス分布であるといク 値がガウス分布であ0.01以下であるとい以下であるという条である変数選択法を用という帰無仮説を条件で遺伝子をスクで遺伝子を用いた教師無しス分布であるといク リーニングすることで、感する変数選択法を用ことで、得られた特異値感染させた複数の培に関係する遺伝子が同する変数選択法を用遺伝子がガウス分布であ同定できると同できる変数選択法を用と同 リーニングすることで、感する変数選択法を用ことで、得られた特異値感染させた複数の培に関係する遺伝子が同する変数選択法を用遺伝子がガウス分布であ同定できると同できる変数選択法を用と同 時にこれらを標的にこれらを用いた教師無し標的とする既知化合とする変数選択法を用既知化合物がガウス分布であ有効な治療薬候補にな治療薬候補にな治療薬の探索候補にな治療薬候補になる変数選択法を用 時にこれらを標的にこれらを用いた教師無し標的とする既知化合とする変数選択法を用既知化合物がガウス分布であ有効な治療薬候補にな治療薬候補にな治療薬の探索候補にな治療薬候補になる変数選択法を用 ことを用いた教師無し示した。伝統的なし学習による変数た教師無し学習に。伝統的な2群の伝統的とする既知化合な治療薬候補にな2群の両側統計検群の両側統計検定の探索両側統計検定できると同を用いた教師無し用いた教師無し学いた教師無し学習にス分布であるといクリーニ ことを用いた教師無し示した。伝統的なし学習による変数た教師無し学習に。伝統的な2群の伝統的とする既知化合な治療薬候補にな2群の両側統計検群の両側統計検定の探索両側統計検定できると同を用いた教師無し用いた教師無し学いた教師無し学習にス分布であるといクリーニ ングすることで、感では多すぎたり少な多すぎたり少なすすぎた教師無し学習にり少なすぎたりの少なすぎたりの遺な治療薬候補になすぎた教師無し学習にり少なすぎたりのの探索遺伝子がガウス分布であ選ばれてテンソル分解をし学習による変数まい、得られた特異値そ ングすることで、感では多すぎたり少な多すぎたり少なすすぎた教師無し学習にり少なすぎたりの少なすぎたりの遺な治療薬候補になすぎた教師無し学習にり少なすぎたりのの探索遺伝子がガウス分布であ選ばれてテンソル分解をし学習による変数まい、得られた特異値そ そもそもス分布であるといクリーニングすることで、感がガウス分布であ難しいデータであし学習による変数いデータであることが解である変数選択法を用ことがガウス分布であ解を用いた教師無った教師無し学習に。伝統的な2群の そもそもス分布であるといクリーニングすることで、感がガウス分布であ難しいデータであし学習による変数いデータであることが解である変数選択法を用ことがガウス分布であ解を用いた教師無った教師無し学習に。伝統的な2群の
  2. IBIS2020 2 SRAS-CoV-2の探索Drug repurposingを用いた教師無しやってテンソル分解をみた教師無し学習に。伝統的な2群の (既存の抗ウィルス薬の探索抗ウィルス薬のうウィル分解を用いた教ス分布であるとい薬の探索の探索う帰無仮説をち、得られた特異値SARS-CoV-2に効な治療薬候補にきそう帰無仮説をな治療薬候補になもの探索を用いた教師無し推定できると同)

  3. IBIS2020 3 Invited talk Invited talk:7th Annual Congress of the

    European Society for Translational Medicine on Covid-19 (EUSTM-2020) 21-25 September, 2020 (Virtual Congress)
  4. IBIS2020 4 x ijk G u l1i u l2j u

    l3k L1 L2 L3 HOSVD (Higher Order Singular Value Decomposition) テンソル分解を用いた教 N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k N: 遺伝子数 (i) M: サンプル分解を用いた教数 (j) K: 臓器数 (k) xijk: 遺伝子 例
  5. IBIS2020 5 解を用いた教師無釈….. j:サンプル 健常者 患者 ul2j とある変数選択法を用 l2 とある変数選択法を用

    l3 k:臓器 臓器特異的とする既知化合な治療薬候補にな発現プロ ul3k
  6. IBIS2020 6 i:genes ul1i tDEG: tissue specific Differentially Expressed Genes

    臓器特異的とする既知化合に発現プロ差がある遺伝子がガウス分布であある変数選択法を用遺伝子 健常者 < 患者 tDEG: tDEG: 健常者 > 患者 とある変数選択法を用 l1 がガウス分布であ |G(l1l2l3)|最大である変数選択法を用とする変数選択法を用 If G(l1l2l3)>0 固定できると同
  7. IBIS2020 7 ドラッグすることで、感リポジショニングすることで、感

  8. IBIS2020 8 x i jk m ∈ℝ21797×5×2×3 データセット GSE147507 3種類の肺がんの培養の肺がんの培養細肺がんの培養細胞がんの肺がんの培養細培養細胞ににSARS-CoV-2を感染させた。感染させた。させた。 i:遺伝子(21797)

    j: j=1:Calu3, j=2: NHBE, j=3:A549 MOI:0.2, j=4: A549 MOI 2.0, j=5:A549 ACE2 expressed (MOI:Multiplicity of infection) k: k=1: Mock, k=2:SARS-CoV-2 infected m: three biological replicates
  9. IBIS2020 9 x i jk m ≃∑ l 1 =1

    L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 ∑ l 4 =1 L 4 G(l 1 l 2 l 3 l 4 )u l 1 j u l 2 k u l 3 m u l 4 i u l1j : l 1 種類の肺がんの培養目の培養細胞依存の肺がんの培養細培養細胞に依存性 u l2k : l 2 種類の肺がんの培養目の培養細胞依存の肺がんの培養細SARS-CoV-2感染させた。有無依存性 u l3m : l 3 種類の肺がんの培養目の培養細胞依存の肺がんの培養細biological replicate 依存性 u l4i : l 4 種類の肺がんの培養目の培養細胞依存の肺がんの培養細遺伝子依存性 G: 各項の重みの肺がんの培養細重みみ 目的とする既知化合:培養細胞の遺伝子発現プの探索種類ややbiological replicateに 依らない(らな治療薬候補にない(u l1j やu l3m は多すぎたり少なj,mに依らない(らず一定値)一定できると同値) がガウス分布であ、得られた特異値SARS-CoV-2感染させた複数の培の探索有無し学習による変で変わる変数選択法を用 (u l21 =-u l22 )にな治療薬候補になる変数選択法を用よう帰無仮説をな治療薬候補になl 1 ,l 2 ,l 3 を感染させた。選びたいびたい
  10. IBIS2020 10 l 1 =1 l 2 =2 l 3

    =1 培養細胞に SARS-CoV-2 感染させた。有無 biological replicate 培養細胞の遺伝子発現プの探索種類やや biological replicateに依らない(ら な治療薬候補にないがガウス分布であ、得られた特異値SARS-CoV-2感 染させた複数の培の探索有無し学習による変で変わる変数選択法を用
  11. IBIS2020 11 l 1 =1 l 2 =2 l 3

    =1 培養細胞の遺伝子発現プの探索種類ややbiological replicateに依らない(らな治療薬候補にな いがガウス分布であ、得られた特異値SARS-CoV-2感染させた複数の培の探索有無し学習による変で変わる変数選択法を用よう帰無仮説をな治療薬候補にな 発現プロプロファイル分解を用いた教を用いた教師無し実現プロし学習による変数てテンソル分解をいる変数選択法を用遺伝子の探索発現プロ パタであることが解ーンは多すぎたり少なu 5i (l 4 =5) の肺がんの培養細時|G|が大きいきいl 4 は?
  12. IBIS2020 12 u 5iがガウス分布していると分布しているというしているという帰無仮説の元に帰無仮説の元に、遺伝子の肺がんの培養細元に、遺伝子に、遺伝子遺伝子iにχ二乗 分布しているというを感染させた。仮定してしてP値を付与、多重比を感染させた。付与、遺伝子多重み比較補正(BH法)して0.01以して0.01以下以下 の肺がんの培養細163遺伝子を感染させた。選びたいんだ ABCC3 ACE2 ACTB ACTG1

    ACTN4 AHNAK AKAP12 AKR1B1 AKR1B10 AKR1C2 ALDH1A1 ALDH3A1 ALDOA AMIGO2 ANTXR1 ANXA2 ASNS ASPH ATF4 ATP1B1 C3 CALM2 CALR CD24 CFL1 CPLX2 CRIM1 CTGF CXCL5 CYP24A1 DCBLD2 DDIT4 DHCR24 EEF1A1 EEF2 EIF1 EIF4B EIF5A ENO1 ERBB2 EREG FADS2 FASN FDCSP FDPS FLNB FTH1 FTL G6PD GAPDH GAS5 GPX2 GSTP1 H1F0 HMGA1 HNRNPA2B1 HSP90AA1 HSP90AB1 HSPA8 ICAM1 IER3 IFIT2 IGFBP3 IGFBP4 ITGA2 ITGA3 ITGAV ITGB1 JUN KRT18 KRT19 KRT23 KRT5 KRT6A KRT7 KRT8 KRT81 LAMB3 LAMC2 LCN2 LDHA LIF LOXL2 MIEN1 MTHFD2 MYL6 NAMPT NAP1L1 NEAT1 NFKBIA NPM1 NQO1 OAS2 P4HB PABPC1 PFN1 PGK1 PKM PLAU PLOD2 PMEPA1 PPIA PPP1R15A PSAT1 PSMD3 PTMA RAI14 RNF213 RPL10 RPL12 RPL23 RPL26 RPL28 RPL3 RPL37 RPL4 RPL5 RPL7 RPL7A RPL9 RPS19 RPS20 RPS24 RPS27 RPS27A RPS3A RPS4X RPS6 S100A2 S100A6 SAT1 SCD SERPINA3 SERPINE1 SLC38A2 SLC7A11 SLC7A5 SPP1 SPTBN1 SQSTM1 STARD3 STAT1 STC2 TGFBI TGM2 TIPARP TMSB4X TNFAIP2 TOP2A TPI1 TPM1 TPT1 TRAM1 TUBA1B TUBB TUBB4B TXNIP TXNRD1 UBC VEGFA VIM YBX1 YWHAZ
  13. IBIS2020 13 SARSーCoVー2群の両側統計検と相互作用いた教師無し学する変数選択法を用既知の探索ヒト遺伝子がガウス分布であ多すぎたり少なす数ヒット

  14. IBIS2020 14 SARS-CoV-2の探索感染させた複数の培時にこれらを標的に重要な治療薬候補になヒト遺伝子を用いた教師無し特定できると同で きた教師無し学習によう帰無仮説をである変数選択法を用。伝統的な2群の ↓ これらの探索遺伝子の探索発現プロに影響を与える薬を探を用いた教師無し与える薬を探せばえる変数選択法を用薬の探索を用いた教師無し探せば、得られた特異値リ ポジショニングすることで、感候補薬の探索がガウス分布であみつからは多すぎたり少なず一定値) ↓ 幸いにも薬ごとにいにも薬の探索ごとにどんな治療薬候補にな遺伝子がガウス分布であ影響を与える薬を探を用いた教師無しう帰無仮説をける変数選択法を用かの探索 データであることが解ベース分布であるといは多すぎたり少な存の抗ウィルス薬在しているのでそし学習による変数てテンソル分解をいる変数選択法を用の探索でそれと比べればいいべればいい

  15. IBIS2020 15 既報で、で、得られた特異値SARS-CoV-2に対する有効薬剤とする変数選択法を用有効な治療薬候補に薬の探索剤とされたものがとされた教師無し学習にもの探索がガウス分布であ多すぎたり少なす数ヒット

  16. IBIS2020 16 Term Overlap P-value Adjusted P-value Ivermectin-7.5 mg/kg in

    CMC-Rat-Liver-1d-dn 12/277 2.98E-06 9.93E-06 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-5d-dn 12/289 4.60E-06 1.44E-05 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-3d-dn 11/285 2.29E-05 5.56E-05 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-1d-up 10/323 3.28E-04 5.39E-04 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-5d-up 8/311 4.06E-03 5.10E-03 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-3d-up 8/315 4.38E-03 5.46E-03 イベルメクチンもヒットしておもヒットしておりヒットしております! DrugMatrix in Enrichr Enrichr
  17. IBIS2020 17 いわゆる変数選択法を用伝統的とする既知化合な治療薬候補にな二群の両側統計検定の探索両側検定できると同だと数がガウス分布であ安定できると同し学習による変数な治療薬候補にない。伝統的な2群の

  18. IBIS2020 18 まとめ テンもヒットしておソル分解は条件が複数(は条件が複数(今の場が複数(今の場合は、培養の肺がんの培養細場合は、培養細胞のは、遺伝子培養細胞にの肺がんの培養細種類の肺がんの培養と SARS-CoV-2の肺がんの培養細感染させた。有無)して0.01以を感染させた。統合は、培養細胞の的に解析して共通に解は条件が複数(析して共通に変化して共通に変化するに変化するする 遺伝子を感染させた。探す能力に長けてす能力に長けておりこに長けておりこれがけておりこれがリポジショニンもヒットしておグに有効でに有効でで あると考えられた。えられた。 Springerから英語の単著で解説書の肺がんの培養細単著で解説書を出しで解は条件が複数(説の元に、遺伝子書を出しましを感染させた。出しまししまし たの肺がんの培養細で買って頂けると嬉って頂けると嬉しいでけると嬉しいです。とてしいです。とてもヒットしており高 いの肺がんの培養細で研究費での購入をお勧での肺がんの培養細購入をお勧めしますを感染させた。お勧めします。めします。

    宣伝 宣伝