Slide 8
Slide 8 text
Copyright © Elix, Inc. All rights reserved.
• 製薬企業・スタートアップを含む10の団体がデータを出し合って、連合学習でグローバルモデルを訓練
◦ 約26億件のデータ点で訓練 (化合物数: 約2100万件, アッセイ数: 約4万件)
▪ 現在もデータが取得されているアッセイデータ (Alive) と、データ取得が完了したアッセイデータ
(Historical) に分類されている
▪ アッセイごとに、Panel (オフターゲット効果を確認), ADME, Others (オンターゲット効果を確認)
に分類されている
◦ 各クライアントは、データの前処理マニュアルに従ってツール (MELLODDY-TUNER) を用いて前処理
▪ 訓練に利用するデータセットへの制約、特徴ベクトルの作成方法などの統一
• クライアントごとに、予測タスクが異なっている
MELLODDY[1, 2]
8
[1] W. Heyndrickx, et al. J. Chem. Inform. Model. 64(7), 2331–2344, 2024. [2] M. Oldenhof, et al. Proc. AAAI Conf. Artif. Intell. Vol. 37. No. 13. 2023.