GPU accelerating your computation in Python

Jacob Tomlinson Senior Software Engineer, RAPIDS Dask Core Maintainer GPU
accelerating your computation in Python EGU General Assembly 2022 EGU22-7610, https://doi.org/10.5194/egusphere-egu22-7610, 2022.

2 RAPIDS https://github.com/rapidsai

3 Jake VanderPlas - PyCon 2017

4 Pandas Analytics CPU Memory Data Preparation Visualization Model Training
Scikit-Learn Machine Learning NetworkX Graph Analytics PyTorch, TensorFlow, MxNet Deep Learning Matplotlib Visualization Dask Open Source Data Science Ecosystem Familiar Python APIs

5 cuDF cuIO Analytics GPU Memory Data Preparation Visualization Model
Training cuML Machine Learning cuGraph Graph Analytics PyTorch, TensorFlow, MxNet Deep Learning cuxfilter, pyViz, plotly Visualization Dask RAPIDS End-to-End Accelerated GPU Data Science

6 RAPIDS Matches Common Python APIs CPU-based Clustering from sklearn.datasets
import make_moons import pandas X, y = make_moons(n_samples=int(1e2), noise=0.05, random_state=0) X = pandas.DataFrame({'fea%d'%i: X[:, i] for i in range(X.shape[1])}) from sklearn.cluster import DBSCAN dbscan = DBSCAN(eps = 0.3, min_samples = 5) y_hat = dbscan.fit_predict(X)

7 from sklearn.datasets import make_moons import cudf X, y =
make_moons(n_samples=int(1e2), noise=0.05, random_state=0) X = cudf.DataFrame({'fea%d'%i: X[:, i] for i in range(X.shape[1])}) from cuml import DBSCAN dbscan = DBSCAN(eps = 0.3, min_samples = 5) y_hat = dbscan.fit_predict(X) RAPIDS Matches Common Python APIs GPU-accelerated Clustering

8 Benchmarks: Single-GPU cuML vs Scikit-learn 1x V100 vs. 2x
20 Core CPUs (DGX-1, RAPIDS 0.15)

9 Exactly as it sounds—our goal is to make RAPIDS
as usable and performant as possible wherever science is done. We will continue to work with more open source projects to further democratize acceleration and efficiency in science. RAPIDS Everywhere The Next Phase of RAPIDS

10 Statistical genetics toolkit in Python

11 Integrations, feedback, documentation support, pull requests, new issues, or
code donations welcomed! APACHE ARROW GPU OPEN ANALYTICS INITIATIVE https://arrow.apache.org/ @ApacheArrow http://gpuopenanalytics.com/ @GPUOAI RAPIDS https://rapids.ai @RAPIDSai DASK https://dask.org @Dask_dev Work with us Everyone Can Help!

THANK YOU Jacob Tomlinson jtomlinson@nvidia.com @_jacobtomlinson

GPU accelerating your computation in Python

GPU accelerating your computation in Python

Jacob Tomlinson

More Decks by Jacob Tomlinson

Other Decks in Science

Featured

Transcript

Jacob Tomlinson Senior Software Engineer, RAPIDS Dask Core Maintainer GPU

2 RAPIDS https://github.com/rapidsai

3 Jake VanderPlas - PyCon 2017

4 Pandas Analytics CPU Memory Data Preparation Visualization Model Training

5 cuDF cuIO Analytics GPU Memory Data Preparation Visualization Model

6 RAPIDS Matches Common Python APIs CPU-based Clustering from sklearn.datasets

7 from sklearn.datasets import make_moons import cudf X, y =

8 Benchmarks: Single-GPU cuML vs Scikit-learn 1x V100 vs. 2x

9 Exactly as it sounds—our goal is to make RAPIDS

10 Statistical genetics toolkit in Python

11 Integrations, feedback, documentation support, pull requests, new issues, or

THANK YOU Jacob Tomlinson jtomlinson@nvidia.com @_jacobtomlinson