Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
oku-slide-20231129
Search
Makito Oku
December 28, 2023
Research
0
170
oku-slide-20231129
クラリネットプロット: バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の表示法
奥 牧人 (富山大学)
2023/11/29
第76回 バイオ情報学研究会
Makito Oku
December 28, 2023
Tweet
Share
More Decks by Makito Oku
See All by Makito Oku
oku-slide-20240802
okumakito
0
190
oku-slide-20230827
okumakito
0
180
oku-slide-20230213
okumakito
0
270
oku-slide-20221212
okumakito
0
130
oku-slide-20221129
okumakito
0
180
oku-slide-20221115
okumakito
0
390
oku-slide-20220820
okumakito
0
430
oku-slide-stat1-1
okumakito
0
330
oku-slide-stat1-2
okumakito
0
370
Other Decks in Research
See All in Research
AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data
satai
3
660
Open Gateway 5GC利用への期待と不安
stellarcraft
2
170
[RSJ25] Enhancing VLA Performance in Understanding and Executing Free-form Instructions via Visual Prompt-based Paraphrasing
keio_smilab
PRO
0
190
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
400
【NICOGRAPH2025】Photographic Conviviality: ボディペイント・ワークショップによる 同時的かつ共生的な写真体験
toremolo72
0
110
Community Driveプロジェクト(CDPJ)の中間報告
smartfukushilab1
0
120
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
490
言語モデルの地図:確率分布と情報幾何による類似性の可視化
shimosan
8
2.4k
J-RAGBench: 日本語RAGにおける Generator評価ベンチマークの構築
koki_itai
0
1.1k
20251023_くまもと21の会例会_「車1割削減、渋滞半減、公共交通2倍」をめざして.pdf
trafficbrain
0
150
説明可能な機械学習と数理最適化
kelicht
2
800
超高速データサイエンス
matsui_528
1
340
Featured
See All Featured
Thoughts on Productivity
jonyablonski
73
5k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
61
51k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
110
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Crafting Experiences
bethany
0
25
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
0
2.3k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.5k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
0
84
YesSQL, Process and Tooling at Scale
rocio
174
15k
Transcript
クラリネットプロット: バイオリンプロットに代わる scRNA-seqデータの ゼロ過剰分布の表示法 奥 牧人 (富山大学) 2023/11/29 第76回 バイオ情報学研究会
1 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 2
/ 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 3
/ 27
はじめに 単一細胞RNAシーケンス (single cell RNA-sequencing) 略して scRNA-seq 試料中の各細胞に含まれるmRNAなどの転写産物の量を 次世代シーケンサーで網羅的に計測する手法 非常に多くの0の値を含む
ゼロ過剰 な分布を示す。 0の値の発生を ドロップアウト と呼ぶ。 4 / 27
バイオリンプロット scRNA-seqデータには バイオリンプロット がよく使われる。 しかし、0の割合が大きいと非ゼロの部分が潰れてしまう。 5 / 27
クラリネットプロット 本研究では クラリネットプロット を提案する。 0の割合と非ゼロの分布を同時に表すことが出来る。 6 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 7
/ 27
バイオリンプロット ヒストグラムと似ている。 ヒストグラムを滑らかにした ような カーネル密度推定 を使う。 これを複製して反転し、元の図に 加える。 縦向きにする。 元論文では内側に箱ひげ図を
入れていたが、scRNA-seqでは 入れないことも多い。 8 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 9
/ 27
クラリネットプロット データを大きさの順に並べて 棒グラフにする。 棒グラフの上端を結んで 折れ線グラフにする。 横軸を0から1までの 分位数 に 置き換える。 図を複製して反転し、元の図に
加える。 (必要に応じて) 縦向きにする。 10 / 27
分位関数 クラリネットプロットは 分位関数 に対応する。 確率密度関数を積分したものが累積分布関数 累積分布関数の逆関数が分位関数 11 / 27
名前について クラリネットプロットという名前は、バイオリンプロットとの 関係が分かりやすいよう、楽器の中から選んだ。 他にも幾つか考えたが、既に別の意味で使われていた。 つららプロット (Kruskal & Landwehr, 1983) 鍾乳石プロット
(Atkinson & Mulira, 1993) トランペットプロット (Corte, Liou & O'Reilly, 2023) 芋虫プロット (van Buuren & Fredriks, 2001) 12 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 13
/ 27
人工データへの適用例 1番を基準 2, 3番は平均を変更 4, 5番は分散を変更 6, 7番は歪度を変更 8番は二峰性 14
/ 27
実データへの適用例 GSE180139のデータ を使用 ランダムに10個 15 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 16
/ 27
描画スタイル A. 上下反転、B. 横向き、C. 末尾の直線を非表示、D. 縦軸を分位数 でなく順位に変更 17 / 27
描画スタイル、続き E. 半分、F. バイオリンプロットと半分ずつ、G. ヒートマップ、 H. 縞模様 18 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 19
/ 27
適さない例、その1 複雑な分布の形を調べるのには向いていない。 おそらく積分により高周波成分の信号が弱まるため 20 / 27
適さない例、その2 外れ値を含むデータにも適していない。 最大幅は最大値で決まるので、細くなってしまう。 21 / 27
適さない例、その3 負の値を含むデータにも必ずしも適さない。 例えば、3番のピーク付近が細く表示され、直観に反する。 22 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 23
/ 27
公開ツール クラリネットプロットを作図するPythonのコードは GitHubで公開済み https://github.com/okumakito/clarinet_plot Google Colabのノートブックで開けるようにしてある。 24 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 25
/ 27
まとめと考察 まとめ バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の 表示法として、クラリネットプロットを提案した。 0の割合と非ゼロの分布を同時にうまく表せる。 一部の細胞のみで高発現する遺伝子のデータ分布を見るには、 バイオリンプロットより適していると考えられる。 考察 普及するかどうかはSeurat (スーラ)
次第 少なくとも私は同期性揺らぎ遺伝子の 研究で今後使う予定 26 / 27
ご清聴どうもありがとうございました! 27 / 27