Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Statistical approaches for differential express...
Search
Y-h. Taguchi
August 25, 2021
Science
0
220
Statistical approaches for differential expression analysis in metatranscriptomics
ISMB/ECCB2021読み会
https://connpass.com/event/221002/
2021/8/30 14:00ー18:00
Y-h. Taguchi
August 25, 2021
Tweet
Share
More Decks by Y-h. Taguchi
See All by Y-h. Taguchi
マウス肝炎ウイルス感染の遺伝子発現へのテンソル分解の適用によるSARS-CoV-2感染関連重要ヒト遺伝子と有効な薬剤の同定
tagtag
0
76
大学のアウトリーチ活動(中央大学学員(OB)会主催学術講演で講演して)
tagtag
1
43
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
0
81
マルチオミクスデータ解析のためのカーネルテンソル分解による新しい特徴選択法
tagtag
1
78
学術講演会中央大学学員会大分支部
tagtag
0
120
学術講演会中央大学学員会いわき支部
tagtag
0
130
テンソル分解を用いた教師なし学習による変数選択法のシングルセルマルチオミックスデータ解析への応用
tagtag
1
120
学術講演会中央大学学員会八王子支部
tagtag
0
270
教師なしテンソル分解に基づく、有糸分裂後の転写再活性化におけるヒストン修飾ブックマークとしての転写因子候補の抽出法
tagtag
0
160
Other Decks in Science
See All in Science
はじめてのバックドア基準:あるいは、重回帰分析の偏回帰係数を因果効果の推定値として解釈してよいのか問題
takehikoihayashi
2
1.3k
ICRA2024 速報
rpc
3
6k
The thin line between reconstruction, classification, and hallucination in brain decoding
ykamit
1
1.2k
Reconciling Accuracy, Cost, and Latency of Inference Serving Systems
pjamshidi
0
120
ベイズ最適化をゼロから
brainpadpr
2
1.1k
化学におけるAI・シミュレーション活用のトレンドと 汎用原子レベルシミュレーター: Matlantisを使った素材開発
matlantis
0
440
メール送信サーバの集約における透過型SMTP プロキシの定量評価 / Quantitative Evaluation of Transparent SMTP Proxy in Email Sending Server Aggregation
linyows
0
670
【健康&筋肉と生産性向上の関連性】 【Google Cloudを企業で運用する際の知識】 をお届け
yasumuusan
0
460
Online Feedback Optimization
floriandoerfler
0
910
Iniciativas independentes de divulgação científica: o caso do Movimento #CiteMulheresNegras
taisso
0
960
240510 COGNAC LabChat
kazh
0
180
私たちのプロダクトにとってのよいテスト/good test for our products
camel_404
0
250
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
45
9.4k
How to Think Like a Performance Engineer
csswizardry
22
1.4k
Into the Great Unknown - MozCon
thekraken
35
1.6k
Build The Right Thing And Hit Your Dates
maggiecrowley
34
2.5k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Testing 201, or: Great Expectations
jmmastey
42
7.2k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Scaling GitHub
holman
459
140k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
2.1k
Optimizing for Happiness
mojombo
376
70k
Building an army of robots
kneath
303
45k
Large-scale JavaScript Application Architecture
addyosmani
511
110k
Transcript
Bioinformatics, 37, 2021, i34–i41 doi: 10.1093/bioinformatics/btab327 ISMB/ECCB 2021 Statistical approaches
for differential expression analysis in metatranscriptomics Yancong Zhang, Kelsey N. Thompson , Curtis Huttenhower and Eric A. Franzosa
Metatranscriptomics = Metagenomeのトランスクリプトランスクリプトーム版版 微生物集団の転写物をのトランスクリプ転写物をHTS(high throughput sequencing)で計測、で計測、計測、 種ごとの転写物ラごとのトランスクリプ転写物ライブラリにマッピング(計マッピング(計測ごとに「種計測ごとにマッピング(計「種種ごとの転写物ラ×転写物量 のトランスクリプ表」が出来ている」が出来ている、と出来ている、というている、という前提)前提)で計測、 問題点: 転写物のトランスクリプ量=一個体あたりの遺伝子あたりのトランスクリプ遺伝子の発現量のトランスクリプ発現量(A)×個体あたりの遺伝子数(B)
なのトランスクリプで計測、(A)と(B)を分離できないと発現で計測、きないと発現差のある(のトランスクリプある(計測ごとに「種A)で計測、のトランスクリプ同定は不能。は不能。不能。 発現差のある(が出来ている、とあるかどう前提)は不能。(A)で計測、比べるべき。 べるべき。 (B)は不能。別途、メタゲノム版解析をしておけば推をしておけば推定出来るが、推定は不能。出来ている、というるが出来ている、と、そのトランスクリプ情報がが出来ている、と 無い場合もある。い場合もある。その場もある。そのトランスクリプ場合もある。その場どう前提)すれば推定出来るが、いいか?
Work flow for taxon- specific normalization. (PeerJ, 2017年 http://dx.doi.org/10.7717/ peerj.3859)
このトランスクリプ論文にはにマッピング(計は不能。taxon-specific normalizationのトランスクリプ説明が一が出来ている、と一 言もないので別論もないのトランスクリプで計測、別論文にはから 引用。 種ごとの転写物ラごとにマッピング(計RNA量を 規格化した後、遺伝子した後、遺伝子の発現量ごと にマッピング(計足し直してから発し直してから発現差してから発現差のある(が出来ている、と あると遺伝子の発現量を探す、といす、とい う前提)方法(計測ごとに「種黄と青が別種。濃と青が別種。濃が出来ている、と別種ごとの転写物ラ。濃 淡が遺伝子の種類が出来ている、と遺伝子の発現量のトランスクリプ種ごとの転写物ラ類)で計測、。 条件1 条件2 種ごとの転写物ラ2 種ごとの転写物ラ1 種ごとの転写物ラ1 種ごとの転写物ラ2 種ごとの転写物ラ1 種ごとの転写物ラ2 遺 伝 子の発現量 5 種ごとの転写物ラ 類 発 現 差のある( あ り
モデル: log(計測ごとに「種代謝量)で計測、〜(計測ごとに「種カテゴリ変数:実験条件)で計測、 代謝量=π s P s , 代謝量を確率P s のトランスクリプ積で表すモデルをで計測、表」が出来ているすモデルを採用。
x ijk :遺伝子の発現量iのトランスクリプ種ごとの転写物ラjのトランスクリプ条件kにマッピング(計おける転写量, x ik =Σ j x ijk C:
x ijk /(Σ i=1 Nx ik /N),T: x ijk /(Σ i=1 Nx ijk /N),Tax RNA : Σ i=1 Nx ijk (計測ごとに「種個体あたりの遺伝子数のトランスクリプ代用)で計測、 DNAと書かれているものかれているものトランスクリプは不能。x ijk をメタゲノム版解析をしておけば推で計測、検出した遺伝子の発現量 数で計測、置き換えたもの。き換えたもの。えたものトランスクリプ。pは不能。形質(計測ごとに「種実験条件)で計測、依存性
M1は不能。転写物量のトランスクリプサンプル平均 M2は不能。転写物量のトランスクリプ種ごとの転写物ラごと平均。 M3は不能。転写物量のトランスクリプ種ごとの転写物ラごと平均のトランスクリプ説明が一変数にマッピング(計種ごとの転写物ラごとのトランスクリプ転写物量のトランスクリプ総 量を考慮(計測ごとに「種後述)で計測、 M4は不能。転写物量と遺伝子の発現量量のトランスクリプサンプル平均のトランスクリプ比べるべき。 を考える M5は不能。転写物量のトランスクリプサンプル平均のトランスクリプ説明が一変数にマッピング(計、種ごとの転写物ラごとのトランスクリプ遺伝子の発現量量 (計測ごとに「種個体あたりの遺伝子数にマッピング(計相当)で計測、のトランスクリプ総量を考慮 M6は不能。転写物量のトランスクリプサンプル平均のトランスクリプ差のある(を比べるべき。 べる時に、遺伝子量にマッピング(計、遺伝子の発現量量(計測ごとに「種個体あたりの遺伝子
数にマッピング(計相当)で計測、を考慮
M1〜M3は不能。metatranscriptomicsだけで計測、計算できるで計測、きる M4〜M6は不能。メタゲノム版(計測ごとに「種DNA)で計測、のトランスクリプ計測が出来ている、とないと計算できるで計測、きない。
M4は不能。 C(転写物量)で計測、/C(計測ごとに「種遺伝子の発現量数)で計測、~pp みたいにマッピング(計書かれているものいてあるが出来ている、とこれだとモデルとしては不能。M6 C(転写物量)で計測、~pC(計測ごとに「種遺伝子の発現量数)で計測、+pp のトランスクリプ部分集合もある。その場にマッピング(計なってしまう前提)(計測ごとに「種M6で計測、C(計測ごとに「種遺伝子の発現量数)で計測、のトランスクリプ回帰係数が出来ている、と1だと M4にマッピング(計帰着する)する)で計測、。 M6が出来ている、とM4よりよい、となるとそもそも転写物量が出来ている、と個体あたりの遺伝子数にマッピング(計比べるべき。 例するとすると いう前提)仮定は不能。さえ壊れている(細菌れている(計測ごとに「種細菌の集団としてののトランスクリプ集団の転写物をとしてのトランスクリプスケーリング効果?)で計測、 ことにマッピング(計なるのトランスクリプで計測、意味があるかどうかが出来ている、とあるかどう前提)か不明が一。
Synthetic data 2000個のトランスクリプ遺伝子の発現量プールを準備し、種ごとにそし、種ごとの転写物ラごとにマッピング(計そのトランスクリプう前提)ちのトランスクリプ1000遺 伝子の発現量を持っているとしたっているとした。 種ごとの転写物ラ数は不能。100種ごとの転写物ラ 各種ごとの転写物ラが出来ている、ともっている1000遺伝子の発現量は不能。80%のトランスクリプ確率で計測、発現する。 遺伝子の発現量のトランスクリプ発現量、個体あたりの遺伝子数は不能。対数正規分布 発現量×個体あたりの遺伝子数が出来ている、と検出にマッピング(計かかるとする。 メタゲノム版のトランスクリプ情報がが出来ている、とある想定は不能。のトランスクリプ場合もある。その場(計測ごとに「種M4ーM6)は不能。個体あたりの遺伝子数のトランスクリプ情報が も使うう前提)
None
M3-M6のトランスクリプパフォーマンスは不能。大体あたりの遺伝子同じくらい。 M3は不能。付加的なメタゲノム解なメタゲノム版解析をしておけば推(計測ごとに「種DNA)で計測、のトランスクリプ情報がが出来ている、とない純粋 なMetatranstriptomicsで計測、も実行可能なのトランスクリプで計測、 log(種ごとの転写物ラごと平均)〜log(種ごとの転写物ラのトランスクリプ総発現量)+実験条件実験条件 が出来ている、とベストと判明が一。
実データのトランスクリプ場合もある。その場
M3やM4のトランスクリプ検出力が弱いわけじゃが出来ている、と弱いわけじゃなくいわけじゃなくM6と矛盾しているだけ。しているだけ。 M6が出来ている、と正しいという前提)保証はないは不能。ない
まとめ Synthetic dataのトランスクリプ場合もある。その場、メタゲノム版のトランスクリプデータを併用しないM3は不能。併 用するM4〜M6と同等程度の能力がある(のトランスクリプ能力が弱いわけじゃが出来ている、とある(計測ごとに「種多分、これが出来ている、とこのトランスクリプ論文には のトランスクリプ唯一のトランスクリプオリジナルな結果)で計測、。 しかし、現実のトランスクリプデータにマッピング(計適用するとM3,M4,M6のトランスクリプ結果は不能。バラバラ で計測、、どれが出来ている、と正解かもよく解らない。 (計測ごとに「種ちょっと研究の意義がよくわのトランスクリプ意義がよくわかりまが出来ている、とよくわかりませんで計測、した)で計測、
なんで計測、採択されたか?されたか? 正直してから発現差、わかりません。Eric A. Franzosaは不能。2016年以降一万回以年以降一万回以 上、引用されているMetatranscrpitomicsのトランスクリプ専門家のようなのでのトランスクリプよう前提)なのトランスクリプで計測、 それで計測、採択されたか?されたのトランスクリプで計測、は不能。ないか。 新しい分野で世界しい分野で世界に先駆けで計測、世界に先駆けてにマッピング(計先駆けてけてNature Methodにマッピング(計論文にはを出せれば推定出来るが、 ISMB/ECCBにマッピング(計も論文にはが出来ている、と採択されたか?されると言もないので別論えるだろう前提)。 だが出来ている、と、実験機器の開発現場からのトランスクリプ開発現場から遠い日本人にはこい日本人にはこれは難しにマッピング(計は不能。これは不能。難しいしい
し、Nature Methodにマッピング(計論文には通すほうがすほう前提)が出来ている、とISMB/ECCBにマッピング(計論文には通すほうがすよ り難しいしそう前提)なのトランスクリプで計測、、日本人にはこれは難しが出来ている、と、ISMB/ECCBにマッピング(計論文には通すほうがすにマッピング(計は不能。どう前提)す べきかという前提)問のトランスクリプ答えにはならないえにマッピング(計は不能。ならないと思います。います。