Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BioPackathon2025 シングルセル解析プラットフォームShortCakeの紹介
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
中戸隆一郎(Ryuichiro Nakato)
November 20, 2025
Research
98
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
BioPackathon2025 シングルセル解析プラットフォームShortCakeの紹介
中戸隆一郎(Ryuichiro Nakato)
November 20, 2025
More Decks by 中戸隆一郎(Ryuichiro Nakato)
See All by 中戸隆一郎(Ryuichiro Nakato)
BioPackathon2024 ゲノム立体構造解析とHiC1Dmetricsの紹介
rnakato
0
88
Other Decks in Research
See All in Research
Harness Engineering and Al Agent
kzinmr
3
1.7k
Dual Quadric表現を用いた動的物体追跡とRGB-D・IMU制約の密結合によるオドメトリ推定
nanoshimarobot
0
420
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
3.9k
言語モデルから言語について語る際に押さえておきたいこと
eumesy
PRO
5
2.4k
Ghost in the 7‑Zip: The Shadow of Residential Proxies Creeping into Your Life
nttcom
0
1.3k
CVPR2026論文紹介_VLMにとって良いvision encoderとは何か?Rethinking Model Selection in VLM Through the Lens of Gromov-Wasserstein Distance
kobayashi31
1
150
明日から使える!研究効率化ツール入門
matsui_528
13
7.4k
通時的な類似度行列に基づく単語の意味変化の分析
rudorudo11
0
320
Sleuthcon Keynote - How Cybercriminals (ab)use AI
fr0gger
0
210
Model Discovery and Graph Simulation: A Lightweight Gateway to Chaos Engineering
anatolykr
0
210
【中間報告】国会議員の立法・政策実務を支える環境を巡る現状と課題
polipoli
0
140
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
570
Featured
See All Featured
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
KATA
mclloyd
PRO
35
15k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
170
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Navigating Team Friction
lara
192
16k
Writing Fast Ruby
sferik
630
63k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
123
22k
Believing is Seeing
oripsolob
1
150
Technical Leadership for Architectural Decision Making
baasie
3
420
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Transcript
シングルセル解析プラットフォーム ShortCakeの紹介 東京大学定量生命科学研究所 大規模生命情報解析研究分野 中戸隆一郎 2025/11/19 Bio"Pack"athon 2025 #11 @RyuichiroNakato
2 Bioinformatics Application Noteに採択 (2025年) First release (version
1) は2020年 現在のバージョンはv3.4.0 新規性 < 実用性 長年使ってきた中で加えた様々な工夫が 入っています 本日の内容: ShortCakeとは? Dockerとは? 使い方? 何故ShortCakeを作ろうと思ったか?
さまざまなシングルセル解析手法 3 Stuart and Satija, Nature Reviews, 2019 細胞内不均一性 Heterogeneity
分化軌道推定 Trajectory Azizi et al., Cell, 2018 La Manno et al., Nature, 2018 マルチモーダル解析
4 scRNA-tools database https://www.scrna-tools.org/ scRNA-seqに含まれるさまざまな解析ステップ Luecken et al., Mol Syst
Biol. 2019 より改変
課題 手法の多さ(単一のツールで完結しない) 複数のツールを試す必要がある R・Python・コマンドライン インストールで時間を取られる・あるいは諦めてしまうというのはもったいない
Developers: 作ったツールを使って欲しい Users: 全て試すことはできない:少数の有名なツールだけ使う パイプラインで壁(コスト)を削減 ユーザはより多くのツールをトライすることができる デベロッパは使ってもらえると嬉しい 超えられない壁 5
異なるPCで 解析環境を共有 (再現性の確保) イメージをダウンロード (一度で良い) ユーザ1 ユーザ2 ShortCakeの Dockerイメージ (rnakato/shortcake)
コンテナ 起動 (様々なDockerイメージが 登録されているWebサイト) 解析サーバ ノートPCなど オープンクロマチン 遺伝子発現 疑似時系列解析 空間的遺伝子発現 様々な解析が可能! ShortCake: Docker-based single-cell analysis platform https://hub.docker.com/r/rnakato/shortcake 6
Docker image Share the environment among PCs PC2 … …
<your account>/<image name>:<tag> Download the image (docker pull) ユーザ Build the image (docker build) Upload the image (docker push) PC1 コンテナ コンテナ上でコマンドを起動 (docker run) Docker:計算環境を複数ユーザ・計算機で共有する枠組み Dockerfile Image Image 7
Docker imageのダウンロードと実行 # Start docker $ sudo service docker start
# Download the ShortCake image $ docker pull rnakato/shortcake:3.4.0 # Excecute a command in ShortCake $ docker run --rm -p 8888:8888 -it rnakato/shortcake:3.4.0 <command> # Example: Jupyter notebook $ docker run --rm -p 8888:8888 -it rnakato/shortcake:3.4.0 jupyternotebook.sh # Example: Rstudio Server $ docker run --rm -p 8787:8787 -it rnakato/shortcake:3.4.0 rserver.sh 8787 # GPUを使う場合 $ docker run --rm -p 8888:8888 -it --gpus all rnakato/shortcake:3.4.0 jupyternotebook.sh 8
Dockerコマンドの代替:Apptainer, Podmanなど # Apptainer $ apptainer build -F shortcake.sif docker://rnakato/shortcake
$ apptainer exec shortcake.sif jupyternotebook.sh # GPUを使う場合 $ apptainer exec --nv shortcake.sif jupyternotebook.sh 9
ツール一覧 10 https://github.com/rnakato/ShortCake/
Micromambaを使ったPython仮想環境の構築 https://mamba.readthedocs.io/en/latest/user_guide/micromamba.html Micromamba C++で書かれたconda互換バイナリ バイナリ形式で配布されている Condaよりも高速・安定
Python仮想環境 バージョンコンフリクトを防ぐことがで きる 環境が冗長化・イメージサイズが肥大化 しやすい 仮想環境をどの程度切り分けるかは悩み どころではある Rツール群は全てlocal Rで使える 11
Jupyter notebook 12 Jupyter kernelとして 仮想環境にアクセス可能 Selected kernel
Rstudio Server 13 Seurat, SeuratDataの実行例
共用サーバ ユーザ1 コンテナ サーバ上でコンテナを起動 (Jupyter notebook) (Rstudio) サーバからのアクセス イメージを ダウンロード
ユーザ2 ブラウザからアクセス (http://<サーバのIP>:8888/) (http://localhost:8888/) ローカルからリモートサーバの特定ポートへのトンネル ssh -N -f -L localhost:8888:localhost:8888 servername 14 ブラウザからアクセス (http://<サーバのIP>:8889/) (http://localhost:8889/)
InteractiveなインタフェースはJupyter notebookでは動かない 15 “Monocle3” https://cole-trapnell-lab.github.io/monocle3/docs/trajectories/#subset-branch # Rstudio GUI $ apptainer
exec shortcake.sif rstudio RStudio GUIもインストールさ れているが、ややproblematic
ShortCake flavors (フレーバー) インストールされているツールは増え続ける イメージサイズが大きくなりすぎると、アップロード・ダウンロードに時間がかかり、実用的でなくな る ラップトップPCなどHDD容量やメモリサイズが小さい場合、ダウンロードそのものが困難になる場合
もある 多くのユーザは全てのツールを利用する必要がない とはいえ、仮想環境ごとにイメージを切り分けるのも管理が煩雑になる 「フレーバー」として、複数のイメージに分割 16
ShortCake flavors (フレーバー) 17
データサイズ一覧 Docker Singularity/Apptainer 18
ShortCakeは誰のためのものか・誰のためのものではないか 特に、解析の経験が浅い研究者に向けてデザインされている インストールトラブルに慣れていない人 たとえば、新しくラボに入った学生など 様々なツールを試してみたい人向け
RとPythonを両方使いたい人(Seurat Wrappersやscverseとも異なる) Seuratだけで完結するような用途には不要 同一ツールの異なるバージョンを比較したり、厳密なバージョンを要求する人には向いてい ない(上級者) ワークフロー言語(NextFlow)の代替ではない NextFlowはひとつの統一的なワークフローを構築するためのもの ShortCakeは個人レベル・あるいは小グループで試行錯誤するための環境を提供する 19
DockerHubにバージョンタグ付きのイメージを公開 GitHubに元となるDockerfileや関連ファイルを公開 DockerHubとGitHubを互いにリンクする READMEは共有 20 パッケージング周りの話:DockerHubへの登録
DockerHub GitHub Zenodo
Dockerfileの例(一部) 21
何故 ShortCakeを作ろうと思ったか? 22
新学術領域「細胞ダイバース」(2017年~2022年) 23 [事後評価報告書より引用] シングルセル解析のための解析パイプラインの構築と解析支援を担当
計算環境をどう公開・共有するか? Webサーバを構築してブラウザとして公開 サーバの維持管理は大変 サーバダウンしているとアクセスできない 個人検体データはコピーできないかも
ユーザ数が増えるとハングするかも 自動化しづらい(大量のクエリだと大変) 複数バージョンを置きづらい(異なるユーザが異なるバージョンを使っているとか) 各自が自由に新しいツールをインストールできないのはよくない 各研究所にサーバを配置 一人で管理するのは無理、環境がばらつく トラブルシュートが困難 ツールとして公開 「解析環境の構築」が解析者の前に立ちはだかる最初の大きな壁になる 大量のツールをインストールすると、ライブラリのバージョンコンフリクトの問題が発生する 24
解析環境のパッケージ化(Docker) 種々のツールやライブラリをインストールし、セットアップされた「環境」をイメージ として提供することで、インストールコストを減らす アノテーションデータも必要があれば入れておける Dockerの利点 完全に同一の環境を複数人(複数端末)で共有可能
当時のバージョンのライブラリを補完可能 インストールエラーのトラブルから解放される Dockerの欠点 Dockerの使い方を学ぶ必要がある 環境によってはインストールが困難 25
シングルセル解析講習会 (2019/10/2) 既存のチュートリアルを日本語化したもの 資料は公開しています(https://singlecellanalysistutorial.readthedocs.io/en/latest/) Google Colabにしました 26
オープンコミュニティとしてのパイプラインの試み 最適な手法は「場合による」 結果の解釈はユーザに委ねられている どの手法から得られたデータが最も「確からしい」か? 経験知(の共有)が重要
最新のツール群のフィージビリティスタディ(使用感や適用結果の知見の共有) Dockerパイプラインをを使うことで同一の環境が保証される OSに依存しない 解析に関する知見の共有が容易 実データへの適用結果の共有の試み 1細胞解析のベストプラクティス、結果の解釈、失敗事例などの部分は論文化されにくく、情報が共有されない 細胞ダイバース内において1細胞解析の知見を共有することで研究を加速化する・ひいてはコミュニティに貢献 これはうまくいかない(情報提供側に具体的なメリットがない) たとえば情報共有SNS(Slackなど)を立てても、質問者が出ても回答者が出なそう 実際には共同研究・あるいは研究プロジェクトなどの議論を通してしか知見は広まらないのでは 27
その後(サポートいただいている研究プロジェクト) 細胞ダイバース(singlecell_jupyter) AMED-PRIME「早期ライフ」 ShortCakeの誕生 現在は「創薬等先端技術支援基盤プラットフォーム(BINDS)」でも活用 されています
28
余談:arXivへのプレプリントの公開(html版が便利!) 29
ShortCake ぜひご利用ください!