Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
oku-slide-20231129
Search
Makito Oku
December 28, 2023
Research
0
170
oku-slide-20231129
クラリネットプロット: バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の表示法
奥 牧人 (富山大学)
2023/11/29
第76回 バイオ情報学研究会
Makito Oku
December 28, 2023
Tweet
Share
More Decks by Makito Oku
See All by Makito Oku
oku-slide-20240802
okumakito
0
190
oku-slide-20230827
okumakito
0
180
oku-slide-20230213
okumakito
0
270
oku-slide-20221212
okumakito
0
120
oku-slide-20221129
okumakito
0
180
oku-slide-20221115
okumakito
0
390
oku-slide-20220820
okumakito
0
430
oku-slide-stat1-1
okumakito
0
330
oku-slide-stat1-2
okumakito
0
370
Other Decks in Research
See All in Research
高畑鬼界ヶ島と重文・称名寺本薬師如来像の来歴を追って/kikaigashima
kochizufan
0
110
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
120
生成AIとうまく付き合うためのプロンプトエンジニアリング
yuri_ohashi
0
100
データサイエンティストの業務変化
datascientistsociety
PRO
0
110
大規模言語モデルにおけるData-Centric AIと合成データの活用 / Data-Centric AI and Synthetic Data in Large Language Models
tsurubee
1
470
Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities
satai
3
320
CoRL2025速報
rpc
3
3.7k
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
230
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
120
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
460
LLM-jp-3 and beyond: Training Large Language Models
odashi
1
740
Open Gateway 5GC利用への期待と不安
stellarcraft
2
170
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
50
14k
How to Talk to Developers About Accessibility
jct
1
92
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
210
RailsConf 2023
tenderlove
30
1.3k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
The Pragmatic Product Professional
lauravandoore
37
7.1k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
180
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.2k
SEO for Brand Visibility & Recognition
aleyda
0
4.1k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
140
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
1k
Transcript
クラリネットプロット: バイオリンプロットに代わる scRNA-seqデータの ゼロ過剰分布の表示法 奥 牧人 (富山大学) 2023/11/29 第76回 バイオ情報学研究会
1 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 2
/ 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 3
/ 27
はじめに 単一細胞RNAシーケンス (single cell RNA-sequencing) 略して scRNA-seq 試料中の各細胞に含まれるmRNAなどの転写産物の量を 次世代シーケンサーで網羅的に計測する手法 非常に多くの0の値を含む
ゼロ過剰 な分布を示す。 0の値の発生を ドロップアウト と呼ぶ。 4 / 27
バイオリンプロット scRNA-seqデータには バイオリンプロット がよく使われる。 しかし、0の割合が大きいと非ゼロの部分が潰れてしまう。 5 / 27
クラリネットプロット 本研究では クラリネットプロット を提案する。 0の割合と非ゼロの分布を同時に表すことが出来る。 6 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 7
/ 27
バイオリンプロット ヒストグラムと似ている。 ヒストグラムを滑らかにした ような カーネル密度推定 を使う。 これを複製して反転し、元の図に 加える。 縦向きにする。 元論文では内側に箱ひげ図を
入れていたが、scRNA-seqでは 入れないことも多い。 8 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 9
/ 27
クラリネットプロット データを大きさの順に並べて 棒グラフにする。 棒グラフの上端を結んで 折れ線グラフにする。 横軸を0から1までの 分位数 に 置き換える。 図を複製して反転し、元の図に
加える。 (必要に応じて) 縦向きにする。 10 / 27
分位関数 クラリネットプロットは 分位関数 に対応する。 確率密度関数を積分したものが累積分布関数 累積分布関数の逆関数が分位関数 11 / 27
名前について クラリネットプロットという名前は、バイオリンプロットとの 関係が分かりやすいよう、楽器の中から選んだ。 他にも幾つか考えたが、既に別の意味で使われていた。 つららプロット (Kruskal & Landwehr, 1983) 鍾乳石プロット
(Atkinson & Mulira, 1993) トランペットプロット (Corte, Liou & O'Reilly, 2023) 芋虫プロット (van Buuren & Fredriks, 2001) 12 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 13
/ 27
人工データへの適用例 1番を基準 2, 3番は平均を変更 4, 5番は分散を変更 6, 7番は歪度を変更 8番は二峰性 14
/ 27
実データへの適用例 GSE180139のデータ を使用 ランダムに10個 15 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 16
/ 27
描画スタイル A. 上下反転、B. 横向き、C. 末尾の直線を非表示、D. 縦軸を分位数 でなく順位に変更 17 / 27
描画スタイル、続き E. 半分、F. バイオリンプロットと半分ずつ、G. ヒートマップ、 H. 縞模様 18 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 19
/ 27
適さない例、その1 複雑な分布の形を調べるのには向いていない。 おそらく積分により高周波成分の信号が弱まるため 20 / 27
適さない例、その2 外れ値を含むデータにも適していない。 最大幅は最大値で決まるので、細くなってしまう。 21 / 27
適さない例、その3 負の値を含むデータにも必ずしも適さない。 例えば、3番のピーク付近が細く表示され、直観に反する。 22 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 23
/ 27
公開ツール クラリネットプロットを作図するPythonのコードは GitHubで公開済み https://github.com/okumakito/clarinet_plot Google Colabのノートブックで開けるようにしてある。 24 / 27
Outline はじめに バイオリンプロット クラリネットプロット 適用例 描画スタイル クラリネットプロットが適さない例 公開ツール まとめと考察 25
/ 27
まとめと考察 まとめ バイオリンプロットに代わるscRNA-seqデータのゼロ過剰分布の 表示法として、クラリネットプロットを提案した。 0の割合と非ゼロの分布を同時にうまく表せる。 一部の細胞のみで高発現する遺伝子のデータ分布を見るには、 バイオリンプロットより適していると考えられる。 考察 普及するかどうかはSeurat (スーラ)
次第 少なくとも私は同期性揺らぎ遺伝子の 研究で今後使う予定 26 / 27
ご清聴どうもありがとうございました! 27 / 27