Upgrade to Pro — share decks privately, control downloads, hide ads and more …

疾患とDrugMatrixデータセットとの間の 遺伝子発現の統合解析における テンソル分解を用いた教師なし学習による変数選択 を用いた候補薬物の同定

Y-h. Taguchi
September 21, 2018
110

疾患とDrugMatrixデータセットとの間の 遺伝子発現の統合解析における テンソル分解を用いた教師なし学習による変数選択 を用いた候補薬物の同定

第55回BIO研究発表会
http://www.ipsj.or.jp/kenkyukai/event/bio55.html
日時:平成30年9月18日(火) 14:00-16:55
会場:鶴岡メタボロームキャンパス共用棟1F大会議室
での講演。原著論文は
https://doi.org/10.1038/s41598-017-13003-0

Y-h. Taguchi

September 21, 2018
Tweet

More Decks by Y-h. Taguchi

Transcript

  1. 疾患とDrugMatrixデータセットとの間の 遺伝子発現の統合解析における テンソル分解を用いた教師なし学習による変数選択 を用いた候補薬物の同定 中央大学理工学部物理学科 田口善弘 Y.-h. Taguchi, “Identification of

    candidate drugs using tensor-decomposition-based unsupervised feature extraction in integrated analysis of gene expression between diseases and DrugMatrix datasets”, Scientific Reports,7:13733 (2017)
  2. 創薬プロセスは複雑で長時間かかるのでわずか でもそのプロセスの短縮にインシリコ(AI創薬)の 立場から貢献したい 伝統的なAI創薬: リガンドベース: 既知の創薬候補化合物との類似性から新規創薬 化合物を推定する。 利点:予測精度が高い。計算量的に軽微。 欠点:標的疾患・タンパクに対して既知の有効な 化合物が知られていない場合、何もできない。

    既知化合物と類似性が低い化合物を見つけるの は難しい。
  3. 伝統的なAI創薬: 構造ベース: タンパクの立体構造に対して化合物のドッキン グシミュレーションを行って、新規創薬化合物を 推定する。 利点:全く未知の創薬化合物を推定できる。 既知の有効な化合物の情報は不要。 欠点:計算量的にハードである。 タンパクの立体構造が未知の場合、構造の推 定もインシリコで行わなくてはならず、推定精度

    に問題がある。
  4. 新しいAI創薬: 遺伝子発現プロファイルベース: 培養細胞やモデル生物に化合物を投与した場合の 遺伝子発現プロファイルを比較し、既知有効化合物 と類似していれば同じ薬効(標的タンパクへの結合、 疾患への有効性)も同じであると考える。 利点:既知有効化合物と構造的に類似性がない化 合物でも推定可能。 計算路量的に軽微。 欠点:既知有効化合物がない場合の疾患・標的タ

    ンパクに対しては推定が行えない。
  5. → この欠点を解消する可能性がある 遺伝子発現プロファイルベースでのAI 創薬手法を提案する。 → 遺伝子発現プロファイルから教師 なし学習で化合物の標的タンパクがわ かる方法がほしい

  6. ある時、突然、PCAが使えると気づいた....。 N 遺伝子 カテゴリクラス 主成分分析 PC1 サンプル M サンプル N

    × M 行列X (実数値) PC2 PC1 クラス間差異なし N遺伝子×Mサンプルの遺伝子発現量/プロモーターメチル化/ non-coding RNA発現量の行列があったとする。Mサンプルはク ラス(図では4)に分かれているとする。遺伝子を低次元に埋め込 むとクラス間で差がある遺伝子が外側にはじき出される (•)。PC1がクラス間差異を表現するので。 主成分 得点 主成分負荷量
  7. 人工データによるデモ 人工データによるデモ 10 サンプル 10 サンプル 90 遺伝子 10 遺伝子

    N(0,1/2) N(m,1/2) [N(m,1/2)+N(0,1/2)]/2 +:Top 10 外れ値 m=2 つまり、外れ値を選べば、 2 クラス間で差異がある遺伝 子を自動的に(教師なしで) 選択できる 精度 精度:(100 :(100 試行中 試行中) ) 89.5% (m=2) 52.6% (m=1) PC1 PC2 正規分布 μ:平均  ½ :標準偏 差
  8. 化合物選択もしたい。 化合物×濃度依存性×遺伝子、だと行列で表現不能 →テンソル 更に疾患選択もしたい。 →いちいち、疾患ごとに実験できない 解決策:発現プロファイルを組み合わせる 行列1:遺伝子×(患者 vs 健常者) テンソル2:遺伝子×薬物×投与後時間

  9. × x ij x il x ij ×x il x

    ijl Tensor decomposition G x ik1 x jk2 x lk3 x ijl =x ij ×x il ≒Σ k1,k2,k3 G k1,k2,k3 x ik1 x jk2 x lk3 i:遺伝子 j:患者vs健常者 l:化合物濃度 患者vs健常者 化合物濃度
  10. 例:心臓病 DrugMatrix側: モデル生物:Rat 臓器:心臓 218化合物、4投与後時刻、3937遺伝子 人間側: 313人(82IDC,95IS、136CNTL)、3937遺伝子

  11. x j 3 i x j 1 j 2 j

    3 i =x j 1 j 2 i x j 3 i =∑G(l 1 ,l 2 ,l 3 ,l 4 )u l 1 j 1 u l 2 j 2 u l 3 j 3 u l 4 i x j 1 j 2 i u l 1 j 1 u l 2 j 2 u l 3 j 3 u l 4 i j 1 j 2 j 3 i 化合物 投与後時刻 患者対 健常者 遺伝子 Gene X 標的タンパク
  12. A compounds Genes Single gene perturbation Gene A Gene B

    Gene C TD based unsupervised FE A B C B C
  13. days 薬物投与後時刻: 第1〜4特異値ベクトル

  14. 心臓病 第一〜三特異値ベクトル

  15. 化合物:第二特異値ベクトル

  16. Gの絶対値が大きい順に10個のベクトルを選ぶ

  17. Feature extraction Feature extraction No real data separated well Assume

    Gaussian Detect outliers P i =P[ >∑ k ( x ik σ ) 2 ] Benjamini-Hochberg corrected P <0.01 P-values by χ2 dist P(p) 1-p 0 1
  18. 274遺伝子選択 → 遺伝子KO実験を参照して556(up)/449(down)遺伝子を選択 Akt1 A2m Abcb10 Acads Accn3 Acox3 Acsl1

    Acta1 Actg2 Actn1 Actr1b Acvr1c Adcy3 Adora3 Adra1b Adrb2 Agpat1 Agrn Ak3 Akap1 Alas1 Amhr2 Anxa2 Aoc3 Apob Apod Aqp4 Areg Arf4 Atf3 Atp1b1 Atp5a1 Atp6v1h Azgp1 B4galt7 Bag3 Bmpr1a Bpgm Btbd9 Btg2 Bves Bzw1 C1qa C3 Ca3 Canx Cast Ccl2 Ccnd2 Ccnl1 Ccr1 Cd36 Cd63 Cd74 Cdh23 Cebpg Ces1 Chchd4 Chdh Ciapin1 Cmklr1 Col5a1 Cryab Csda Csnk2b Csrp3 Ctf1 Cyb5b Cybb Dcps Ddit4l Dhrs1 Dlc1 Dnajc5 Dpp4 Dusp11 Ednra Eef2k Egfr Egr1 Eif2s2 Eif4a1 Ephx1 F8 Fabp5 Fbl Fbxo22 Fgf9 Flt1 Fndc5 Fos Fstl1 Fut8 Fyttd1 Gapdh Gatm Gbe1 Ghr Git2 Glul Gna12 Gnb1 Gnb2l1 Gnb3 Gosr1 Got1 Got2 Gpx3 Grwd1 Gstp1 Gucy1a3 Hapln1 Hmbs Hmgb1 Hrc Hspa5 Htr4 Idh3a Idh3g Il1rl1 Il6r Il6st Immt Ing4 Itga6 Itm2c Itpr3 Junb Kcmf1 Kcnj8 Kcnk3 Kcnt1 Kpna1 Lactb2 Laptm4b Lcat Lcp1 Ldha Lphn3 Lrp1 Lss Ltbp4 Man2c1 Map2k4 Map4k3 Mapk10 Mapk14 Mapk6 Mapk9 Mfn2 Mgat3 Mgp Mknk2 Mlycd Mme Mpp3 mrpl9 Msn Mterf Mtus1 Mvd Mxd3 Myc Myl2 Ncoa2 Ndfip1 Ndufs2 Nedd4l Nes Nexn Nf1 Nfatc4 Nfe2l2 Npr3 Nr0b2 Nr3c1 Nr3c2 Nsf Obscn Odz2 P2rx3 Pacsin2 Pccb Pdcl3 Pde4b Pdia4 Pdk2 Pdk4 Pdrg1 Pdxk Pggt1b Pi4k2a Pold4 Ppara Ppif Ppm1a Ppm1b Ppp1r14a Ppp1r14c Ppp2ca Ppp2r2d Prelp Psmb4 Psmc1 Psmd12 Ptgds Ptger2 Pvrl2 Pycr2 Rab15 Ramp2 Rbm10 Rela Rhoa Rplp1 Rps18 Rps20 Rps6 Rxrg Samm50 Sccpdh Schip1 Scn2b Sdhd Sephs2 Serpinh1 Sfrp4 Sharpin Sirt5 Slc25a4 Slc2a4 Slc38a2 Slc40a1 Slc5a1 Slc6a1 Sln Slpi Smad4 Smpd1 Sod1 Sox18 Spin2b Spp1 Stat3 Steap3 Stip1 Stx7 Suclg1 Synj1 Tarbp2 Tfam Tmem30a Tnfaip6 Tnfrsf12a Tnfrsf1a Tnni3 Tpm1 Tpsab1 Trpc4ap Ttn Txndc12 Txnip Uchl1 Uqcrc2 Usp14 Vdac2 Vezt Vim Vsnl1 Vtn Wbp4 Yme1l1 Ywhae Ywhah
  19. Amitriptyline Atropine Baclofen Bezafibrate Caffeine Calcitriol Chlorambucil Cimetidine Citalopram Clemastine

    Clonazepam Cyclophosphamide D- Tubocurarine Chloride Dexamethasone Dexchlorpheniramine Digitoxin Diphenhydramine Doxazosin Ebastine Fenofibrate Fluphenazine Gabapentin Ifosfamide Iproniazid Lacidipine Loratadine Nevirapine Nimodipine Nitrendipine Ofloxacin Oxymetazoline Paroxetine Phenacemide Phenytoin Rosiglitazone Sparteine Stavudine Valsartan Vecuronium Bromide Venlafaxine Vinblastine Vincristine Zidovudine 43化合物選択
  20. None
  21. None
  22. SwissDockによる検証 Chrosisの場合 HnF4a vs Bezafibrate K i = 0.13μM

  23. CYPOR vs Bezafibrate K i = 79nM SwissDockによる検証 Chrosisの場合

  24. 「原発性胆汁性肝硬変に対するbezafibrate療法 の有効性と問題点」 肝臓 Vol. 46 (2005) No. 4 P 200-207

    原発性胆汁性肝硬変 (PBC) 26例, その他の胆道系酵素優位の 肝障害4例を対象にbezafibrateの投与を行い, その有効性と問題 点について検討した. s2-PBC1例を除くすべての症例でALPは bezafibrate投与1カ月後より低下し始め, 3カ月後には36〜78% の低下を認め, その有効性が確認された. また, UDCAの前投与 があった群においても相加的なALPの低下が認められ, 併用療法 が有効と考えられた. しかし, 黄疸を伴う症候性PBC3例中1例は 無効, 他の2例はtransaminaseの上昇を認めており, 投与の是非 は今後の課題と考えられた. さらに, 副作用はほとんどなく安全性 の高い薬剤と報告されているが, 我々の検討では黄疸を伴う症候 性PBC2例を含む6例にtransaminaseの上昇が, 高齢者の1例に 横紋筋融解症が認められ, このような症例においては特に慎重な 投与が必要と考えられた.
  25. Yin et al, “Systematic review and meta-analysis: bezafibrate in patients

    with primary biliary cirrhosis”, Drug Des Devel Ther. 2015 ;9:5407-19. CONCLUSION: Combination therapy improved liver biochemistry and the prognosis of PBC, but did not improve clinical symptoms or incidence of death. Attention should be paid to adverse events when using bezafibrate.
  26. 結論 遺伝子発現プロファイルからの薬剤標的タンパク の統計的推定法の開発を行った。 既存のヒトの疾患遺伝子発現プロファイルと既存 の薬物投与モデル動物の遺伝子発現プロファイル の任意の組み合わせからAI創薬が可能な画期的 な新手法である。