Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
oku-slide-20231129
Search
Makito Oku
November 28, 2023
Research
0
120
oku-slide-20231129
クラリネットプロット: バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の表示法
奥 牧人 (富山大学)
2023/11/29
第76回 バイオ情報学研究会
Makito Oku
November 28, 2023
Tweet
Share
More Decks by Makito Oku
See All by Makito Oku
oku-slide-20240802
okumakito
0
89
oku-slide-20230827
okumakito
0
120
oku-slide-20230213
okumakito
0
220
oku-slide-20221212
okumakito
0
86
oku-slide-20221129
okumakito
0
160
oku-slide-20221115
okumakito
0
310
oku-slide-20220820
okumakito
0
300
oku-slide-stat1-1
okumakito
0
270
oku-slide-stat1-2
okumakito
0
300
Other Decks in Research
See All in Research
Optimal and Diffusion Transports in Machine Learning
gpeyre
0
1.2k
Evaluating Tool-Augmented Agents in Remote Sensing Platforms
satai
2
150
ラムダ計算の拡張に基づく 音楽プログラミング言語mimium とそのVMの実装
tomoyanonymous
0
400
Elix, CBI2024, スポンサードセッション, Molecular Glue研究の展望:近年の進展とAI活用の可能性
elix
0
130
PetiteSRE_GenAIEraにおけるインフラのあり方観察
ichichi
0
270
セミコン地域における総合交通戦略
trafficbrain
0
110
Weekly AI Agents News! 10月号 論文のアーカイブ
masatoto
1
500
Prithvi-EO-2.0: A Versatile Multi-Temporal Foundation Model for Earth Observation Applications
satai
2
150
o1 pro mode の調査レポート
smorce
0
110
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
0
110
情報処理学会関西支部2024年度定期講演会「自然言語処理と大規模言語モデルの基礎」
ksudoh
10
2.5k
論文紹介: COSMO: A Large-Scale E-commerce Common Sense Knowledge Generation and Serving System at Amazon (SIGMOD 2024)
ynakano
1
380
Featured
See All Featured
The Cost Of JavaScript in 2023
addyosmani
47
7.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
120k
Designing Experiences People Love
moore
140
23k
RailsConf 2023
tenderlove
29
1k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
The World Runs on Bad Software
bkeepers
PRO
67
11k
The Language of Interfaces
destraynor
156
24k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Producing Creativity
orderedlist
PRO
344
39k
A Philosophy of Restraint
colly
203
16k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.6k
Transcript
クラリネットプロット: バイオリンプロットに代わる scRNA-seqデータの ゼロ過剰分布の表示法 奥 牧人 (富山大学) 2023/11/29 第76回 バイオ情報学研究会
1 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 2
/ 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 3
/ 27
はじめに 単一細胞RNAシーケンス (single cell RNA-sequencing) 略して scRNA-seq 試料中の各細胞に含まれるmRNAなどの転写産物の量を 次世代シーケンサーで網羅的に計測する手法 非常に多くの0の値を含む
ゼロ過剰 な分布を示す。 0の値の発生を ドロップアウト と呼ぶ。 4 / 27
バイオリンプロット scRNA-seqデータには バイオリンプロット がよく使われる。 しかし、0の割合が大きいと非ゼロの部分が潰れてしまう。 5 / 27
クラリネットプロット 本研究では クラリネットプロット を提案する。 0の割合と非ゼロの分布を同時に表すことが出来る。 6 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 7
/ 27
バイオリンプロット ヒストグラムと似ている。 ヒストグラムを滑らかにした ような カーネル密度推定 を使う。 これを複製して反転し、元の図に 加える。 縦向きにする。 元論文では内側に箱ひげ図を
入れていたが、scRNA-seqでは 入れないことも多い。 8 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 9
/ 27
クラリネットプロット データを大きさの順に並べて 棒グラフにする。 棒グラフの上端を結んで 折れ線グラフにする。 横軸を0から1までの 分位数 に 置き換える。 図を複製して反転し、元の図に
加える。 (必要に応じて) 縦向きにする。 10 / 27
分位関数 クラリネットプロットは 分位関数 に対応する。 確率密度関数を積分したものが累積分布関数 累積分布関数の逆関数が分位関数 11 / 27
名前について クラリネットプロットという名前は、バイオリンプロットとの 関係が分かりやすいよう、楽器の中から選んだ。 他にも幾つか考えたが、既に別の意味で使われていた。 つららプロット (Kruskal & Landwehr, 1983) 鍾乳石プロット
(Atkinson & Mulira, 1993) トランペットプロット (Corte, Liou & O'Reilly, 2023) 芋虫プロット (van Buuren & Fredriks, 2001) 12 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 13
/ 27
人工データへの適用例 1番を基準 2, 3番は平均を変更 4, 5番は分散を変更 6, 7番は歪度を変更 8番は二峰性 14
/ 27
実データへの適用例 GSE180139のデータ を使用 ランダムに10個 15 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 16
/ 27
描画スタイル A. 上下反転、B. 横向き、C. 末尾の直線を非表示、D. 縦軸を分位数 でなく順位に変更 17 / 27
描画スタイル、続き E. 半分、F. バイオリンプロットと半分ずつ、G. ヒートマップ、 H. 縞模様 18 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 19
/ 27
適さない例、その1 複雑な分布の形を調べるのには向いていない。 おそらく積分により高周波成分の信号が弱まるため 20 / 27
適さない例、その2 外れ値を含むデータにも適していない。 最大幅は最大値で決まるので、細くなってしまう。 21 / 27
適さない例、その3 負の値を含むデータにも必ずしも適さない。 例えば、3番のピーク付近が細く表示され、直観に反する。 22 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 23
/ 27
公開ツール クラリネットプロットを作図するPythonのコードは GitHubで公開済み https://github.com/okumakito/clarinet_plot Google Colabのノートブックで開けるようにしてある。 24 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 25
/ 27
まとめと考察 まとめ バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の 表示法として、クラリネットプロットを提案した。 0の割合と非ゼロの分布を同時にうまく表せる。 一部の細胞のみで高発現する遺伝子のデータ分布を見るには、 バイオリンプロットより適していると考えられる。 考察 普及するかどうかはSeurat (スーラ)
次第 少なくとも私は同期性揺らぎ遺伝子の 研究で今後使う予定 26 / 27
ご清聴どうもありがとうございました! 27 / 27