Upgrade to Pro — share decks privately, control downloads, hide ads and more …

IPAB CADD contest 2017 KUF

kubor
December 15, 2017

IPAB CADD contest 2017 KUF

IPAB主催 第4回 IT創薬コンテスト:「コンピュータで薬のタネを創る4」
での手法紹介スライド
http://www.ipab.org/eventschedule/contest/contest4

kubor

December 15, 2017
Tweet

More Decks by kubor

Other Decks in Science

Transcript

  1. 手法紹介| デー タ収集 使用デー タ ChEMBL より、sirtuin1, 2, 3, 4,

    5, 6, 7 に対して計測された活 性阻害実験デー タを収集(n=2,080) BindingDB からも同じ条件でデー タを収集(n=1,440) 第三回コンテストのデー タを追加 (n=3,192) 重複(n=2,502) を削除 IC50 が100 nM 未満のものを 活性なし(n=4,127) 、 それ以 外を 活性あり(n=74) とラベル付けした 3
  2. 手法紹介| 学習と予測 学習 DeepChem[1] のGraph Convolution[2] を使用 活性の有無を分類タスクとして解いた 予測 スコアの高いもの上位400

    化合物を提出 Train accuracy: 0.921、Valid accuracy: 0.717 [1]: deepchem/deepchem: Democratizing Deep‑Learning for Drug Discovery, Quantum Chemistry, Materials Science and Biology [2]: Altae‑Tran, Han, et al. "Low Data Drug Discovery with One‑Shot Learning." ACS central science 3.4 (2017): 283‑293. 4
  3. DeepChem について 化合物デー タを扱うための機械学習ライブラリ Python、TensorFlow、scikit‑learn ベー ス RF やSVM などの機械学習手法のサンプルコー

    ド 種々 のGraph Convolution によるエンコー ダー を用いた深層学習の サンプルコー ド シュレディンガー 社の製品に組み込まれるなど注目されている 6
  4. 使用した計算環境について 全てクラウドで実行 スペック インスタンス AWS EC2 p2.xlarge GPU 1 CPU

    4 RAM 61 GiB 価格 0.900 USD/h 計算時間は約5 時間、 コストは約500 円 クラウド環境と創薬コンテストは抜群に相性がいい 7