Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Let's enjoy open science
Search
Taka
November 12, 2023
0
260
Let's enjoy open science
https://github.com/Mishima-syk/20/blob/main/iwatobipen
Taka
November 12, 2023
Tweet
Share
Featured
See All Featured
Getting science done with accelerated Python computing platforms
jacobtomlinson
0
84
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
410
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.3k
Tell your own story through comics
letsgokoyo
0
770
HDC tutorial
michielstock
1
280
Making the Leap to Tech Lead
cromwellryan
135
9.7k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
990
KATA
mclloyd
PRO
33
15k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
110
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
150
Highjacked: Video Game Concept Design
rkendrick25
PRO
0
260
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Transcript
Let’s enjoy open science 2023/11/11 Mishima.syk #20
自己紹介 • 某製薬企業でケモインフォマティクスやってます • 最近Blueskyのアカウント持ちました • たまにBlog書いてます https://bsky.app/profile/iwatobipen.bsky.social https://twitter.com/iwatobipen https://github.com/iwatobipen
https://iwatobipen.wordpress.com/ 2
祝 Mishimasyk10周年!!!! 1回目はRedmineのハンズオンでしたね〜 3
突然のクイズ(Andrewさんのクイズ) 1,RDKit の RDはなんの略でしょうか? 4
突然のクイズの答え(Andrewさんのクイズ) RDKit の RDはなんの略でしょうか? Rational Discovery “Rational Discovery”, the company which
started RDKit development. 5
RDKitはChemoinfoでは非常に重要なOSSです ▪RDKit ▪OpenBabel 6
RDKit UGM 2023 Hackathon 7
Knime node development with python https://github.com/iwatobipen/rdkitugm2023_hackathon/tree/main/python_knime_node 8 自分でノードが開発できるとそれを配布できる=環境揃える呪縛から開放
なぜ外に情報発信をするのか? • Give&Take(自分がたくさんお世話になってる) • GithubやMailing listなど相談できるコミュニティは重要 • 公開しているコードはOSSベースであり誰でも実装できる 9 •
お互いに情報交換しつつレベルアップできればHappyですよね?
ということで今日も便利なOSSの紹介(From UGM2023) 10 • 引き続き情報発信、続けていきたい所存ですw
その名はScikit-Mol! 11 https://github.com/EBjerrum/scikit-mol
Why we should try to use scikit-mol? • Esben Jannik
Bjerrum氏の開発したパッケージ • Scikit-learnとRDKitの融合によりケモインフォフレンドリーなAPIを提供 • Apache License Version 2.0 12
ということで早速 1. Transform conversions.SmilesToMolTransformer() descriptors.MolecularDescriptorTransformer() fingerprints.MorganFingerprintTransformer(radius, nBits) などを利用することで簡便に記述し、Fingerprintの計算が可能です。 13
Transformを利用したデータ処理のコード 14 • SMILES>>>RDKitMOL>>>Fingerprintが全部これでできちゃいますね!
Pipelineを使えばRDKit Mol objectから モデル構築まで一気通貫〜 15
DefaultでもLightGBM優秀 16
(FYI)Scikit-molの実装から sklearn.base.TransformerMixin, sklearn.base.BaseEsitmater を継承させることでScikit-learnに準拠した独 自のTranfomerを作成できる。 Regressor, Classifierも同様に作成可能 17 https://scikit-learn.org/stable/modules/generated/sklearn.base.TransformerMixin.html
まとめ • Scikit-mol 便利 • RDKit & Scikit-learn(や同じAPIをサポートしているパッケージ)をいい感じにイン テグレートして利用可能 •
Open Scienceでテンポよくケモインフォをしていきましょ〜 18
ご清聴ありがとうございました! 19