Elix, CBI 2023, フォーカストセッション, 生成モデルを中心としたElixにおけるAI創薬

Copyright © Elix, Inc. All rights reserved. 生成モデルを中心とした ElixにおけるAI創薬 CEO
結城伸哉

AI創薬プラットフォーム Elix DiscoveryTM：提供形態 TM Copyright © Elix, Inc. All rights
reserved. ① プラットフォーム提供 • 各社のニーズに合わせて最適な形での提供 • 例1）AI創薬に必要なものを新規に⼀括で提供 • 例2）既存システムを活かしつつ、⼀部拡張 ② 共同研究 • Elix Discovery™の技術を活⽤しつつ共同研究 • 弊社の研究者・エンジニアが稼働 • 世界でもトップクラスの⾼コスト効率な提案例2の既存システム活かす場合のイメージ図ケミストも直感的に使える統合型AI創薬プラットフォーム 2

Elix Discovery™メイン機能及び共同研究 Elix Predict ( 化合物プロファイル予測 ) 化合物構造を⼊⼒することで、活性・物性・ADMET等の化合物プロファイルを予測。
⾃動で最適な予測モデルを作成。 Elix Create ( 構造⽣成 ) 所望のプロファイルを持つ化合物を⽣成。活性・物性・A DMETに加え、合成容易性等を考慮して最適化。 Elix Assist ( アクティブ・ラーニング ) 少ないデータで効率よく学習。より少ない実験数・期間で所望の化合物に到達。追加実験データ追加学習実験所望のプロファイル／起点構造モデル ※現時点ではシステム上ではなく弊社とコラボする形での提供。 Elix Discovery™にも後々組み込む予定プロファイルモデル Copyright © Elix, Inc. All rights reserved. モデル 3

Elix Discovery™メイン機能及び共同研究ドッキングシミュレーション GPUによる⾼速化を⾏い、構造⽣成モデルの学習に組み込み最適化。（同様にファーマコフォアモデルも利⽤可）より⾼精度なシミュレーション。通常は⻑い計算時間がかかるが、アクティブ・ラーニングと組み合わせて⾼速化も。
アクティブ・ラーニング ABFE: Absolute Binding Free Energy FEP: Free Energy Perturbation ABFE, FEP （社内検証中、提供予定企業あり）ドッキング構造⽣成モデル ABFE, FEP 予測モデルシミュレーションと機械学習の融合：それぞれ相補的な強みを活かし、データが少ない状況にも対処シミュレーション機械学習 • 学習データを必要としない • 計算時間がかかる（タンパクの構造情報も必要） Copyright © Elix, Inc. All rights reserved. • 計算が⾼速 • 学習データが必要 4

Elix Discovery™画⾯〜予測モデル学習設定〜 5 Copyright © Elix, Inc. All rights
reserved.

Elix Discovery™画⾯〜構造⽣成モデル最適化項⽬設定〜 6 Copyright © Elix, Inc. All
rights reserved.

Elix Discovery™画⾯〜相互作⽤可視化（3D）〜 7 Copyright © Elix, Inc. All rights
reserved.

Elix Discovery™画⾯〜ファーマコフォアモデル設定〜 8 Copyright © Elix, Inc. All rights
reserved.

Elix Discovery™画面〜Human-in-the-Loop〜 9 Copyright © Elix, Inc. All rights
reserved.

Elix Discovery™画⾯〜予測およびフィルタリング結果〜 10 Copyright © Elix, Inc. All rights
reserved.

主要取引先及びパートナー製薬企業学術機関パートナー製薬企業 Copyright © Elix, Inc. All
rights reserved. 製薬企業製薬企業製薬企業製薬企業製薬企業京都⼤学 11

事例：科研製薬様 ‒ ランチョンセミナーでの事例紹介 Elixランチョンセミナー • 「科研製薬における Elix Discovery™の導⼊及び活⽤事例」 • 科研製薬株式会社
森本恭平様 • ⽇時：10⽉25⽇（⽔）12:00-13:00 • 3つ予定している講演のうち2番⽬ • 場所：タワーホール船堀４階研修室 12

Elix Discovery™によるpan-KRAS阻害剤の⽣成 - 1 13 Copyright © Elix, Inc. All
rights reserved. 問題設定 Elix Discovery™の構造⽣成モデルを活⽤し、pan-KRAS阻害剤を⽣成する Pan-KRAS阻害剤に取り組む意義 • KRASは細胞の増殖等に関わるタンパクで、その変異はがんを引き起こす • ポケットが浅いため、阻害剤の探索が難しい • G12Cに関してはSotorasibとAdagrasibが2021年と2022年に上市。これらは共有結合性阻害剤 • 共有結合では狙えないようなG12Dなどの変異に対して、共有結合を⽤いないpan-KRAS阻害剤の同定が期待される • BI-2865という⾮共有結合性pan-KRAS阻害剤が2023年6⽉に論⽂で報告されているが、まだ⾮臨床試験の段階 Image Sources: Fell, J. B. et al., J. Med. Chem., Vol. 63, pp. 6679-6693 (2020), Kim, D. et al., Nature, Vol. 619, pp. 160–166 (2023)

Elix Discovery™によるpan-KRAS阻害剤の⽣成 - 2 14 Copyright © Elix, Inc. All
rights reserved. 提案⼿法の特徴 • ⽣成モデルとファーマコフォアモデルを組み合わせて利⽤ • 活性値の学習データなしでも新規構造⽣成が可能構造⽣成モデルの最適化設定 • 共結晶構造からファーマコフォアスコアを算出 • 相互作⽤は⾃動で検出し、その後⼿動で⼀部補正 • MW, HBD, HBA, LogP, フィルター結果 • ドッキングシミュレーションやファーマコフォアモデルにおいて起点化合物と同等以上の親和性を⽰す化合物を⽣成 • 複数の新規構造を⽣成今後の予定 • Eurofinsのアッセイ系構築が完了次第、実験による検証を⾏う Elix Discovery™上のファーマコフォアモデルの画⾯ ✕ AI 実験

膜タンパクデータを活⽤したマルチモーダル予測モデル - 1 15 Copyright © Elix, Inc. All rights
reserved. 問題設定 Elixの独⾃モデルにSEEDSUPPLYの独⾃データで学習させ、予測モデルを作成。バーチャルスクリーニング等に役⽴てる。 ✕ AI データ予測モデル • Elixの独⾃モデル • 結合活性を予測 • 化合物情報だけを考慮する通常のモデルと異なり、タンパクの配列情報も考慮 • ドッキング等と異なりタンパクの構造を⼊⼒として必要としない。配列さえあれば良い学習データ • 膜タンパク（SLCトランスポーター、GPCR） • どのタンパクも構造情報がほぼ存在しない • どのターゲットも同じ⼿法でスクリーニングしたクリーンなデータ • タンパクの種類：688 • 化合物数：35,568

reserved. 対象ライブラリ（テストセット） • 全体：約45万化合物 • 真のヒット化合物：タンパクごとに2〜15個含まれる実施内容 • 全ての化合物に対して活性予測を実施し、濃縮率の向上を検証 • 学習データには存在しないタンパクに対して実施（機械学習的には⾮常に難易度の⾼い設定）結果 • ①追加学習なし：全体の約20%の化合物を実際の実験にかければ、真のヒット化合物のうち約40%を取得することが可能 • ②追加学習あり：約10%の実験で約40%のヒットを取得可能 • 注意：上記は今回の実験の中でも良かったもの。構造的に近いタンパクが学習データに多いと良い結果に繋がりやすい。利⽤⽤途 • バーチャルスクリーニングによる実験の効率化 • マウス型等で学習し、ヒト型で発現が困難なタンパクで予測 ②GPR87: 11個のヒット化合物を加えた追加学習あり ①SLC7A1：学習データにヒット化合物なし。追加学習なし Retrain Fine-tune

reserved. ⼝頭発表 • ⼝頭発表O07：「データサイエンス/ADME・毒性」 • "Binding Compound Database Screening using Deep Learning: Strategies for Improved Candidate Enrichment” • Thomas Auzard • 10/25（⽔）17:10〜18:40

独⾃ライブラリkMoLを活⽤した連合学習 kMoL • 創薬に特化した唯⼀の連合学習対応機械学習ライブラリ • 京都⼤学と共同開発 • オープンソース：https://github.com/elix-tech/kmol • 特徴
• 最新のグラフ系モデル • マルチタスク・マルチモーダルでの予測例）タンパクの配列も考慮した予測⼝頭発表 • フォーカストセッション：「創薬におけるプライバシー保護連合学習の最新動向」 • "Efficient and Scalable Framework for Activity Prediction with kMol” • Jun Jin Choong • 10/25（⽔）17:10〜18:40 18

構造⽣成モデルの性能評価⽣成モデルの性能評価における課題 • 創薬に限らず⽣成モデルの評価は⼀般的に難しい • いくつかベンチマーク⼿法が存在するもののどれも⽋点がある • 例１）⼀⾒スコアがよく⾒えても実はuniquenessが考慮されていない。⾼スコアの同じ化合物を⽣成し続けている •
例２）機械学習ベースの予測モデルによるスコアを最⼤化しようとしている。汎化性能に問題があり、幅広くケミカルスペースをカバーしての評価が難しい。⼝頭発表 • ⼝頭発表O03：「ケムインフォマティクス・機械学習/AIによる創薬研究」 • "Benchmarking Deployed Generative Models on Elix Discovery” • Vincent Richard • 10/24（⽕）17:10〜18:40 例１の図。Model 3は⼀⾒よく⾒えるが、実際にはuniquenessが著しくく、⾼スコの化合物を繰り返し⽣成している。 19

Copyright © Elix, Inc. All rights reserved. Bran, A. M.,
Cox, S., White, A. D., & Schwaller, P., arXiv:2304.05376 [physics.chem-ph], Apr. 2023 タスク例：アトルバスタチンの合成とコストアトルバスタチンの合成⽅法を教えてください。必要な試薬を買うといくらかかるかも教えて下さい。単純にアトルバスタチンを買うよりも⾃分で合成した⽅が本当に安いかどうかも教えてください。 GPT-4単独だとそこそこの結果？学習データに含まれる有名な簡単な例だと解けるが、より複雑な問題になると解けなくなる傾向他にも新規化合物の⽣成、物性予測等様々なタスクで検証されている GPT-4 (ChatGPT)に創薬はできるか 21

Copyright © Elix, Inc. All rights reserved. 22 Bran, A.
M., Cox, S., White, A. D., & Schwaller, P., arXiv:2304.05376 [physics.chem-ph], Apr. 2023 インターフェースとしてのLLM • GPT-4単独で全てできるわけではないにしても、タスクを理解し、指⽰出しすることはできる • 構造発⽣、類似度計算、特許チェックなど各専⾨ツールをGPT-4に操作してもらう • GPT-4単独よりも良い結果が得られる傾向。特により難しいタスクにおいて。 • ChatGPTのプラグインのように、LLMと特化型のAIを組み合わせたアプローチが創薬でも役⽴つ可能性。 • LLMは前処理に向いているかも？ • データの前処理はエッジケースが多く、GUIよりも⾃然⾔語の⽅が向いているインターフェースなのかも

ご案内展⽰ブースコーヒーコーナー情報及び連絡先 • １階展⽰ブース 22番 • お気軽にお⽴ち寄りください •
Elixの複数の講演スライドは全てSpeaker Deckで後ほど公開予定です。Xでシェアします。 • X (Twitter): @shinya_elix • Email: [email protected] • 絶賛採⽤中です！ • ４階にElixがスポンサーのコーヒー☕がありますので是⾮ • Elixのチョコレートもあります🍫 23

Elix, CBI 2023, フォーカストセッション, 生成モデルを中心としたElixにお...

Elix, CBI 2023, フォーカストセッション, 生成モデルを中心としたElixにおけるAI創薬

Elix

More Decks by Elix

Other Decks in Research

Featured

Transcript

Copyright © Elix, Inc. All rights reserved. 生成モデルを中心とした ElixにおけるAI創薬 CEO

AI創薬プラットフォーム Elix DiscoveryTM：提供形態 TM Copyright © Elix, Inc. All rights

Elix Discovery™メイン機能及び共同研究 Elix Predict ( 化合物プロファイル予測 ) 化合物構造を⼊⼒することで、活性・物性・ADMET等の化合物プロファイルを予測。

Elix Discovery™画⾯〜予測モデル学習設定〜 5 Copyright © Elix, Inc. All rights

Elix Discovery™画⾯〜構造⽣成モデル最適化項⽬設定〜 6 Copyright © Elix, Inc. All

Elix Discovery™画⾯〜相互作⽤可視化（3D）〜 7 Copyright © Elix, Inc. All rights

Elix Discovery™画⾯〜ファーマコフォアモデル設定〜 8 Copyright © Elix, Inc. All rights

Elix Discovery™画面〜Human-in-the-Loop〜 9 Copyright © Elix, Inc. All rights

Elix Discovery™画⾯〜予測およびフィルタリング結果〜 10 Copyright © Elix, Inc. All rights

主要取引先及びパートナー製薬企業学術機関パートナー製薬企業 Copyright © Elix, Inc. All

事例：科研製薬様 ‒ ランチョンセミナーでの事例紹介 Elixランチョンセミナー • 「科研製薬における Elix Discovery™の導⼊及び活⽤事例」 • 科研製薬株式会社

Elix Discovery™によるpan-KRAS阻害剤の⽣成 - 1 13 Copyright © Elix, Inc. All

Elix Discovery™によるpan-KRAS阻害剤の⽣成 - 2 14 Copyright © Elix, Inc. All

膜タンパクデータを活⽤したマルチモーダル予測モデル - 1 15 Copyright © Elix, Inc. All rights

膜タンパクデータを活⽤したマルチモーダル予測モデル - 2 16 Copyright © Elix, Inc. All rights

膜タンパクデータを活⽤したマルチモーダル予測モデル - 3 17 Copyright © Elix, Inc. All rights

独⾃ライブラリkMoLを活⽤した連合学習 kMoL • 創薬に特化した唯⼀の連合学習対応機械学習ライブラリ • 京都⼤学と共同開発 • オープンソース：https://github.com/elix-tech/kmol • 特徴

Copyright © Elix, Inc. All rights reserved. 20 ChatGPT (GPT-4)

Copyright © Elix, Inc. All rights reserved. Bran, A. M.,

Copyright © Elix, Inc. All rights reserved. 22 Bran, A.

ご案内展⽰ブースコーヒーコーナー情報及び連絡先 • １階展⽰ブース 22番 • お気軽にお⽴ち寄りください •

Copyright © Elix, Inc. All rights reserved. Elix, Inc. https://elix-inc.com/