Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
oku-slide-20231129
Search
Makito Oku
December 28, 2023
Research
190
0
Share
oku-slide-20231129
クラリネットプロット: バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の表示法
奥 牧人 (富山大学)
2023/11/29
第76回 バイオ情報学研究会
Makito Oku
December 28, 2023
More Decks by Makito Oku
See All by Makito Oku
oku-slide-20260209
okumakito
0
66
oku-slide-20240802
okumakito
0
220
oku-slide-20230827
okumakito
0
200
oku-slide-20230213
okumakito
0
300
oku-slide-20221212
okumakito
0
140
oku-slide-20221129
okumakito
0
210
oku-slide-20221115
okumakito
0
410
oku-slide-20220820
okumakito
0
460
oku-slide-stat1-1
okumakito
0
390
Other Decks in Research
See All in Research
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
600
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
940
データセンター事業者を取り巻く近年の状況とその中での研究開発動向、テストベッドへの貢献の可能性
kikuzo
1
120
それ、チームの改善になってますか?ー「チームとは?」から始めた組織の実験ー
hirakawa51
0
1.1k
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.7k
重要だけど測れていないもの:高齢者ケアの見えない課題
theoriatec2024
0
230
東京大学工学部計数工学科、計数工学特別講義の説明資料
kikuzo
0
390
進学校の生徒にはア行の苗字が多いのか
ozekinote
0
400
Using our influence and power for patient safety
helenbevan
0
340
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
230
Data Visualization Tools in the Age of AI
flekschas
0
140
LINEヤフー データサイエンス Meetup「三井物産コモディティ予測チャレンジ」の舞台裏-AlpacaTechパート
gamella
1
490
Featured
See All Featured
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
What does AI have to do with Human Rights?
axbom
PRO
1
2.1k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.8k
So, you think you're a good person
axbom
PRO
2
2k
Documentation Writing (for coders)
carmenintech
77
5.3k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
180
Darren the Foodie - Storyboard
khoart
PRO
3
3.3k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
170
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
140
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
440
Transcript
クラリネットプロット: バイオリンプロットに代わる scRNA-seqデータの ゼロ過剰分布の表示法 奥 牧人 (富山大学) 2023/11/29 第76回 バイオ情報学研究会
1 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 2
/ 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 3
/ 27
はじめに 単一細胞RNAシーケンス (single cell RNA-sequencing) 略して scRNA-seq 試料中の各細胞に含まれるmRNAなどの転写産物の量を 次世代シーケンサーで網羅的に計測する手法 非常に多くの0の値を含む
ゼロ過剰 な分布を示す。 0の値の発生を ドロップアウト と呼ぶ。 4 / 27
バイオリンプロット scRNA-seqデータには バイオリンプロット がよく使われる。 しかし、0の割合が大きいと非ゼロの部分が潰れてしまう。 5 / 27
クラリネットプロット 本研究では クラリネットプロット を提案する。 0の割合と非ゼロの分布を同時に表すことが出来る。 6 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 7
/ 27
バイオリンプロット ヒストグラムと似ている。 ヒストグラムを滑らかにした ような カーネル密度推定 を使う。 これを複製して反転し、元の図に 加える。 縦向きにする。 元論文では内側に箱ひげ図を
入れていたが、scRNA-seqでは 入れないことも多い。 8 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 9
/ 27
クラリネットプロット データを大きさの順に並べて 棒グラフにする。 棒グラフの上端を結んで 折れ線グラフにする。 横軸を0から1までの 分位数 に 置き換える。 図を複製して反転し、元の図に
加える。 (必要に応じて) 縦向きにする。 10 / 27
分位関数 クラリネットプロットは 分位関数 に対応する。 確率密度関数を積分したものが累積分布関数 累積分布関数の逆関数が分位関数 11 / 27
名前について クラリネットプロットという名前は、バイオリンプロットとの 関係が分かりやすいよう、楽器の中から選んだ。 他にも幾つか考えたが、既に別の意味で使われていた。 つららプロット (Kruskal & Landwehr, 1983) 鍾乳石プロット
(Atkinson & Mulira, 1993) トランペットプロット (Corte, Liou & O'Reilly, 2023) 芋虫プロット (van Buuren & Fredriks, 2001) 12 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 13
/ 27
人工データへの適用例 1番を基準 2, 3番は平均を変更 4, 5番は分散を変更 6, 7番は歪度を変更 8番は二峰性 14
/ 27
実データへの適用例 GSE180139のデータ を使用 ランダムに10個 15 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 16
/ 27
描画スタイル A. 上下反転、B. 横向き、C. 末尾の直線を非表示、D. 縦軸を分位数 でなく順位に変更 17 / 27
描画スタイル、続き E. 半分、F. バイオリンプロットと半分ずつ、G. ヒートマップ、 H. 縞模様 18 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 19
/ 27
適さない例、その1 複雑な分布の形を調べるのには向いていない。 おそらく積分により高周波成分の信号が弱まるため 20 / 27
適さない例、その2 外れ値を含むデータにも適していない。 最大幅は最大値で決まるので、細くなってしまう。 21 / 27
適さない例、その3 負の値を含むデータにも必ずしも適さない。 例えば、3番のピーク付近が細く表示され、直観に反する。 22 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 23
/ 27
公開ツール クラリネットプロットを作図するPythonのコードは GitHubで公開済み https://github.com/okumakito/clarinet_plot Google Colabのノートブックで開けるようにしてある。 24 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 25
/ 27
まとめと考察 まとめ バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の 表示法として、クラリネットプロットを提案した。 0の割合と非ゼロの分布を同時にうまく表せる。 一部の細胞のみで高発現する遺伝子のデータ分布を見るには、 バイオリンプロットより適していると考えられる。 考察 普及するかどうかはSeurat (スーラ)
次第 少なくとも私は同期性揺らぎ遺伝子の 研究で今後使う予定 26 / 27
ご清聴どうもありがとうございました! 27 / 27