Slide 11
Slide 11 text
Copyright © Elix, Inc. All rights reserved.
• (通常の予測モデルと同様に) 訓練に使っていないデータセットに
対する予測性能 (汎化性能) が⾼いこと
• 予測モデルの不確実性の評価が正確であること
◦ 間違っている/正しい予測に「不確実性が低い/⾼い」と評価すると、
意思決定を間違える可能性がある
➔ どういったものを利⽤すべきか?
◦ 5種類のモデルで、利⽤する特徴ベクトルを変えて⽐較検討
NGBoost, ガウス過程回帰 (GP), スペクトル正規化GP (SNGP),
GNN-GP, ベイズニューラルネットワーク (BNN)
ECFPフィンガープリント, Mordred記述⼦, GNNでの
特徴抽出
◦ 回帰・2値分類とベイズ最適化のタスクで⽐較
ただし、ハイパーパラメータの最適化などは実施されていない
同様の実験ができるようパッケージ化 (DIONYSUS)
不確実性を測ることができる予測モデルに求められる性能
11
[1] G. Tom, et al. Digit. Discov. 2.3 (2023): 759‒774.