Slide 1

Slide 1 text

深層学習を用いたsirtuin1 脱アセチル化阻害化 合物予測の試み チー ム:G12 KUF 所属: 非公開 第4回IT 創薬コンテスト「 コンピュー タで薬のタネを創る4」 発表会・ 表彰式 2017.12.15 1

Slide 2

Slide 2 text

チー ムKUF IT エンジニア3 名 Kubo Uehara Fujikawa 化合物向けの深層学習ライブラリの使い勝手や性能が気になり参加 2

Slide 3

Slide 3 text

手法紹介| デー タ収集 使用デー タ ChEMBL より、sirtuin1, 2, 3, 4, 5, 6, 7 に対して計測された活 性阻害実験デー タを収集(n=2,080) BindingDB からも同じ条件でデー タを収集(n=1,440) 第三回コンテストのデー タを追加 (n=3,192) 重複(n=2,502) を削除 IC50 が100 nM 未満のものを 活性なし(n=4,127) 、 それ以 外を 活性あり(n=74) とラベル付けした 3

Slide 4

Slide 4 text

手法紹介| 学習と予測 学習 DeepChem[1] のGraph Convolution[2] を使用 活性の有無を分類タスクとして解いた 予測 スコアの高いもの上位400 化合物を提出 Train accuracy: 0.921、Valid accuracy: 0.717 [1]: deepchem/deepchem: Democratizing Deep‑Learning for Drug Discovery, Quantum Chemistry, Materials Science and Biology [2]: Altae‑Tran, Han, et al. "Low Data Drug Discovery with One‑Shot Learning." ACS central science 3.4 (2017): 283‑293. 4

Slide 5

Slide 5 text

GraphConvolution について 原子ごとにRDKit で結合情報、 電荷などを求める 隣接する原子の情報を含めて画像解析で用いられる畳み込み (Convolution) により学習 Altae‑Tran, H. et al. (2017) 5

Slide 6

Slide 6 text

DeepChem について 化合物デー タを扱うための機械学習ライブラリ Python、TensorFlow、scikit‑learn ベー ス RF やSVM などの機械学習手法のサンプルコー ド 種々 のGraph Convolution によるエンコー ダー を用いた深層学習の サンプルコー ド シュレディンガー 社の製品に組み込まれるなど注目されている 6

Slide 7

Slide 7 text

使用した計算環境について 全てクラウドで実行 スペック インスタンス AWS EC2 p2.xlarge GPU 1 CPU 4 RAM 61 GiB 価格 0.900 USD/h 計算時間は約5 時間、 コストは約500 円 クラウド環境と創薬コンテストは抜群に相性がいい 7