Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Let's enjoy open science
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Taka
November 12, 2023
0
260
Let's enjoy open science
https://github.com/Mishima-syk/20/blob/main/iwatobipen
Taka
November 12, 2023
Tweet
Share
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
430
Docker and Python
trallard
47
3.7k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
240
Color Theory Basics | Prateek | Gurzu
gurzu
0
200
Ruling the World: When Life Gets Gamed
codingconduct
0
140
WENDY [Excerpt]
tessaabrams
9
36k
Are puppies a ranking factor?
jonoalderson
1
2.7k
A Modern Web Designer's Workflow
chriscoyier
698
190k
Why Our Code Smells
bkeepers
PRO
340
58k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
160
sira's awesome portfolio website redesign presentation
elsirapls
0
150
Transcript
Let’s enjoy open science 2023/11/11 Mishima.syk #20
自己紹介 • 某製薬企業でケモインフォマティクスやってます • 最近Blueskyのアカウント持ちました • たまにBlog書いてます https://bsky.app/profile/iwatobipen.bsky.social https://twitter.com/iwatobipen https://github.com/iwatobipen
https://iwatobipen.wordpress.com/ 2
祝 Mishimasyk10周年!!!! 1回目はRedmineのハンズオンでしたね〜 3
突然のクイズ(Andrewさんのクイズ) 1,RDKit の RDはなんの略でしょうか? 4
突然のクイズの答え(Andrewさんのクイズ) RDKit の RDはなんの略でしょうか? Rational Discovery “Rational Discovery”, the company which
started RDKit development. 5
RDKitはChemoinfoでは非常に重要なOSSです ▪RDKit ▪OpenBabel 6
RDKit UGM 2023 Hackathon 7
Knime node development with python https://github.com/iwatobipen/rdkitugm2023_hackathon/tree/main/python_knime_node 8 自分でノードが開発できるとそれを配布できる=環境揃える呪縛から開放
なぜ外に情報発信をするのか? • Give&Take(自分がたくさんお世話になってる) • GithubやMailing listなど相談できるコミュニティは重要 • 公開しているコードはOSSベースであり誰でも実装できる 9 •
お互いに情報交換しつつレベルアップできればHappyですよね?
ということで今日も便利なOSSの紹介(From UGM2023) 10 • 引き続き情報発信、続けていきたい所存ですw
その名はScikit-Mol! 11 https://github.com/EBjerrum/scikit-mol
Why we should try to use scikit-mol? • Esben Jannik
Bjerrum氏の開発したパッケージ • Scikit-learnとRDKitの融合によりケモインフォフレンドリーなAPIを提供 • Apache License Version 2.0 12
ということで早速 1. Transform conversions.SmilesToMolTransformer() descriptors.MolecularDescriptorTransformer() fingerprints.MorganFingerprintTransformer(radius, nBits) などを利用することで簡便に記述し、Fingerprintの計算が可能です。 13
Transformを利用したデータ処理のコード 14 • SMILES>>>RDKitMOL>>>Fingerprintが全部これでできちゃいますね!
Pipelineを使えばRDKit Mol objectから モデル構築まで一気通貫〜 15
DefaultでもLightGBM優秀 16
(FYI)Scikit-molの実装から sklearn.base.TransformerMixin, sklearn.base.BaseEsitmater を継承させることでScikit-learnに準拠した独 自のTranfomerを作成できる。 Regressor, Classifierも同様に作成可能 17 https://scikit-learn.org/stable/modules/generated/sklearn.base.TransformerMixin.html
まとめ • Scikit-mol 便利 • RDKit & Scikit-learn(や同じAPIをサポートしているパッケージ)をいい感じにイン テグレートして利用可能 •
Open Scienceでテンポよくケモインフォをしていきましょ〜 18
ご清聴ありがとうございました! 19