Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Let's enjoy open science
Search
Taka
November 12, 2023
0
240
Let's enjoy open science
https://github.com/Mishima-syk/20/blob/main/iwatobipen
Taka
November 12, 2023
Tweet
Share
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
Side Projects
sachag
455
43k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Fireside Chat
paigeccino
39
3.6k
Statistics for Hackers
jakevdp
799
220k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Building Adaptive Systems
keathley
43
2.7k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.8k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
GraphQLとの向き合い方2022年版
quramy
49
14k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.6k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
36
2.5k
Transcript
Let’s enjoy open science 2023/11/11 Mishima.syk #20
自己紹介 • 某製薬企業でケモインフォマティクスやってます • 最近Blueskyのアカウント持ちました • たまにBlog書いてます https://bsky.app/profile/iwatobipen.bsky.social https://twitter.com/iwatobipen https://github.com/iwatobipen
https://iwatobipen.wordpress.com/ 2
祝 Mishimasyk10周年!!!! 1回目はRedmineのハンズオンでしたね〜 3
突然のクイズ(Andrewさんのクイズ) 1,RDKit の RDはなんの略でしょうか? 4
突然のクイズの答え(Andrewさんのクイズ) RDKit の RDはなんの略でしょうか? Rational Discovery “Rational Discovery”, the company which
started RDKit development. 5
RDKitはChemoinfoでは非常に重要なOSSです ▪RDKit ▪OpenBabel 6
RDKit UGM 2023 Hackathon 7
Knime node development with python https://github.com/iwatobipen/rdkitugm2023_hackathon/tree/main/python_knime_node 8 自分でノードが開発できるとそれを配布できる=環境揃える呪縛から開放
なぜ外に情報発信をするのか? • Give&Take(自分がたくさんお世話になってる) • GithubやMailing listなど相談できるコミュニティは重要 • 公開しているコードはOSSベースであり誰でも実装できる 9 •
お互いに情報交換しつつレベルアップできればHappyですよね?
ということで今日も便利なOSSの紹介(From UGM2023) 10 • 引き続き情報発信、続けていきたい所存ですw
その名はScikit-Mol! 11 https://github.com/EBjerrum/scikit-mol
Why we should try to use scikit-mol? • Esben Jannik
Bjerrum氏の開発したパッケージ • Scikit-learnとRDKitの融合によりケモインフォフレンドリーなAPIを提供 • Apache License Version 2.0 12
ということで早速 1. Transform conversions.SmilesToMolTransformer() descriptors.MolecularDescriptorTransformer() fingerprints.MorganFingerprintTransformer(radius, nBits) などを利用することで簡便に記述し、Fingerprintの計算が可能です。 13
Transformを利用したデータ処理のコード 14 • SMILES>>>RDKitMOL>>>Fingerprintが全部これでできちゃいますね!
Pipelineを使えばRDKit Mol objectから モデル構築まで一気通貫〜 15
DefaultでもLightGBM優秀 16
(FYI)Scikit-molの実装から sklearn.base.TransformerMixin, sklearn.base.BaseEsitmater を継承させることでScikit-learnに準拠した独 自のTranfomerを作成できる。 Regressor, Classifierも同様に作成可能 17 https://scikit-learn.org/stable/modules/generated/sklearn.base.TransformerMixin.html
まとめ • Scikit-mol 便利 • RDKit & Scikit-learn(や同じAPIをサポートしているパッケージ)をいい感じにイン テグレートして利用可能 •
Open Scienceでテンポよくケモインフォをしていきましょ〜 18
ご清聴ありがとうございました! 19