Interoperability between Bioconductor and Python for scRNA-seq analysis

Interoperability between Bioconductor and Python for scRNA-seq analysis Luke Zappia
@_lazappi_

What is interoperability? “Ability to quickly and easily switch between
languages/platforms as required”

Why interoperability? 1. Take advantage of strengths 2. Make use
of existing packages 3. Avoid unnecessary reimplementation

Bulk RNA-seq analysis

scRNA-seq analysis Seurat CRAN

Ecosystems

{reticulate} {basilisk} B Python environments R/Python interface scRNA-seq objects Velocity
analysis

Disclaimer Most (almost all) of this is not my work
Package Developer @GitHub Python Alternative

{reticulate} Kevin Ushey @kevinushey J.J. Allaire @jjallaire Yuan Tang @terrytangyuan
RStudio rstudio.org rpy2 install.packages("reticulate")

library(reticulate) # Set Python environment > use_python("/path/to/my/python") # use_virtualenv("my_venv") #
use_condaenv("my_conda_env") # Import Python libraries > pandas w- import("pandas") # Implicitly convert between R and Python > pandas$DataFrame(data = list("Col1" = 1:2, "Col2" = 3:4)) Col1 Col2 1 1 3 2 2 4 # Explicitly convert between R and Python > vec w- 1:4 > vec [1] 1 2 3 4 > py_list w- r_to_py(vec) > py_list [1, 2, 3, 4] > py_to_r(py_list) [1] 1 2 3 4 {reticulate} in R

```{r} # A normal R chunk vec w- 1:4 vec
``` [1] 1 2 3 4 ```{python} # A native Python chunk ls = [5, 6, 7, 8] ls ``` [1, 2, 3, 4] ```{r} # Access Python from R mean(py$ls) ``` 6.5 ```{python} # Access R from Python sum(r.vec) / len(r.vec) ``` 2.5 {reticulate} in R Markdown

Conversion R Python Single-element vector Scalar Multi-element vector List List
of multiple types Tuple Named list Dict Matrix/Array NumPy array data.frame Pandas DataFrame Function Python function NULL, TRUE, FALSE None, True, False

Limitations Manage Python environment Familiarity with Python syntax Only supports
common data structures

{basilisk} Aaron Lun @LTLA Image from Ipipipourax via WikiMedia Commons
(CC BY-SA 3.0) https://commons.wikimedia.org/wiki/File:Basilik_color%C3%A9.jpg BiocManagerw:install("basilisk")

my_env w- basiliskw:BasiliskEnvironment( envname = "my_env", pkgname = "myPkg", packages
= c("pandasw=1.1.2", ww.) ) my_py_fun w- function(ww.) { pandas w- import("pandas") ww. return(output) } my_r_fun w- function(ww.) { output w- basiliskw:basiliskRun( env = my_env, fun = my_py_fun, ww. ) } library(myPkg) output w- my_r_fun(ww.) Set up Python (Conda) environment (ﬁrst time)... Run my_py_fun() in the environment... Return output {basilisk} 1. Deﬁne an environment 2. Create a {reticulate} function 2. Wrap the function in the environment Developer User

Advantages User doesn’t require Python code Automatic environment creation Different
environments/dependencies for each package

{zellkonverter} Aaron Lun @LTLA Luke Zappia @lazappi anndata2ri BiocManagerw:install("zellkonverter")

{basilisk} .h5ad ﬁle readH5AD() AnnData2SCE() SingleCellExperiment ... .h5ad ﬁle AnnData
{basilisk} writeH5AD() SCE2AnnData() AnnData AnnData2SCE() SingleCellExperiment SCE2AnnData() AnnData AnnData

{anndata} Robrecht Cannoodt @rcannood {sceasy} Vladimir Kiselev @wikiselev Ni Huang
@nh3 install.packages("anndata") anndata remotesw:install_github("sceasy")

{velociraptor} Kevin Rue-Albrecht @kevinrue Aaron Lun @LTLA Charlotte Soneson @csoneson
scvelo BiocManagerw:install("velociraptor")

{basilisk} SingleCellExperiment scvelo() AnnData2SCE() AnnData scv.tl.velocity(...) scv.tl.latent_time(...) ... AnnData X
SingleCellExperiment

scVelo Volker Bergen @Volker Bergen pip install scvelo

RNA velocity

Dynamical RNA velocity

CellRank Marius Lange @Marius1311 pip install cellrank

Pancreas development

Summary Interoperability between Bioconductor and Python is already possible {zellkonverter}
converts between SingleCellExperiment and AnnData objects scVelo and CellRank for analysis of dynamic processes

Thanks! Luke Zappia @_lazappi_ @lazappi lazappi.id.au scvelo.org cellrank.org Theis Lab
@fabian_theis @ICBmunich www.comp.bio

Interoperability between Bioconductor and Pytho...

Interoperability between Bioconductor and Python for scRNA-seq analysis

Luke Zappia

More Decks by Luke Zappia

Other Decks in Science

Featured

Transcript