Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Statistical approaches for differential express...
Search
Y-h. Taguchi
August 25, 2021
Science
0
220
Statistical approaches for differential expression analysis in metatranscriptomics
ISMB/ECCB2021読み会
https://connpass.com/event/221002/
2021/8/30 14:00ー18:00
Y-h. Taguchi
August 25, 2021
Tweet
Share
More Decks by Y-h. Taguchi
See All by Y-h. Taguchi
テンソル分解による糖尿病の組織特異的遺伝子発現の統合解析を用いた関連疾患の予測
tagtag
1
43
マウス肝炎ウイルス感染の遺伝子発現へのテンソル分解の適用によるSARS-CoV-2感染関連重要ヒト遺伝子と有効な薬剤の同定
tagtag
0
80
大学のアウトリーチ活動(中央大学学員(OB)会主催学術講演で講演して)
tagtag
1
46
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
0
82
マルチオミクスデータ解析のためのカーネルテンソル分解による新しい特徴選択法
tagtag
1
80
学術講演会中央大学学員会大分支部
tagtag
0
120
学術講演会中央大学学員会いわき支部
tagtag
0
130
テンソル分解を用いた教師なし学習による変数選択法のシングルセルマルチオミックスデータ解析への応用
tagtag
1
120
学術講演会中央大学学員会八王子支部
tagtag
0
270
Other Decks in Science
See All in Science
Valuable Lessons Learned on Kaggle’s ARC AGI LLM Challenge (PyDataGlobal 2024)
ianozsvald
0
240
地表面抽出の方法であるSMRFについて紹介
kentaitakura
1
330
Planted Clique Conjectures are Equivalent
nobushimi
0
120
化学におけるAI・シミュレーション活用のトレンドと 汎用原子レベルシミュレーター: Matlantisを使った素材開発
matlantis
0
460
拡散モデルの原理紹介
brainpadpr
3
6k
創薬における機械学習技術について
kanojikajino
16
5k
生成AI による論文執筆サポートの手引き(ワークショップ) / A guide to supporting dissertation writing with generative AI (workshop)
ks91
PRO
0
400
Healthcare Innovation through Business Entrepreneurship
clintwinters
0
200
03_草原和博_広島大学大学院人間社会科学研究科教授_デジタル_シティズンシップシティで_新たな_学び__をつくる.pdf
sip3ristex
0
140
2024-06-16-pydata_london
sofievl
0
600
240510 COGNAC LabChat
kazh
0
180
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
130
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
430
Documentation Writing (for coders)
carmenintech
67
4.6k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.1k
The Language of Interfaces
destraynor
156
24k
Rails Girls Zürich Keynote
gr2m
94
13k
Gamification - CAS2011
davidbonilla
80
5.2k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Writing Fast Ruby
sferik
628
61k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
Thoughts on Productivity
jonyablonski
69
4.5k
Building Applications with DynamoDB
mza
93
6.2k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Transcript
Bioinformatics, 37, 2021, i34–i41 doi: 10.1093/bioinformatics/btab327 ISMB/ECCB 2021 Statistical approaches
for differential expression analysis in metatranscriptomics Yancong Zhang, Kelsey N. Thompson , Curtis Huttenhower and Eric A. Franzosa
Metatranscriptomics = Metagenomeのトランスクリプトランスクリプトーム版版 微生物集団の転写物をのトランスクリプ転写物をHTS(high throughput sequencing)で計測、で計測、計測、 種ごとの転写物ラごとのトランスクリプ転写物ライブラリにマッピング(計マッピング(計測ごとに「種計測ごとにマッピング(計「種種ごとの転写物ラ×転写物量 のトランスクリプ表」が出来ている」が出来ている、と出来ている、というている、という前提)前提)で計測、 問題点: 転写物のトランスクリプ量=一個体あたりの遺伝子あたりのトランスクリプ遺伝子の発現量のトランスクリプ発現量(A)×個体あたりの遺伝子数(B)
なのトランスクリプで計測、(A)と(B)を分離できないと発現で計測、きないと発現差のある(のトランスクリプある(計測ごとに「種A)で計測、のトランスクリプ同定は不能。は不能。不能。 発現差のある(が出来ている、とあるかどう前提)は不能。(A)で計測、比べるべき。 べるべき。 (B)は不能。別途、メタゲノム版解析をしておけば推をしておけば推定出来るが、推定は不能。出来ている、というるが出来ている、と、そのトランスクリプ情報がが出来ている、と 無い場合もある。い場合もある。その場もある。そのトランスクリプ場合もある。その場どう前提)すれば推定出来るが、いいか?
Work flow for taxon- specific normalization. (PeerJ, 2017年 http://dx.doi.org/10.7717/ peerj.3859)
このトランスクリプ論文にはにマッピング(計は不能。taxon-specific normalizationのトランスクリプ説明が一が出来ている、と一 言もないので別論もないのトランスクリプで計測、別論文にはから 引用。 種ごとの転写物ラごとにマッピング(計RNA量を 規格化した後、遺伝子した後、遺伝子の発現量ごと にマッピング(計足し直してから発し直してから発現差してから発現差のある(が出来ている、と あると遺伝子の発現量を探す、といす、とい う前提)方法(計測ごとに「種黄と青が別種。濃と青が別種。濃が出来ている、と別種ごとの転写物ラ。濃 淡が遺伝子の種類が出来ている、と遺伝子の発現量のトランスクリプ種ごとの転写物ラ類)で計測、。 条件1 条件2 種ごとの転写物ラ2 種ごとの転写物ラ1 種ごとの転写物ラ1 種ごとの転写物ラ2 種ごとの転写物ラ1 種ごとの転写物ラ2 遺 伝 子の発現量 5 種ごとの転写物ラ 類 発 現 差のある( あ り
モデル: log(計測ごとに「種代謝量)で計測、〜(計測ごとに「種カテゴリ変数:実験条件)で計測、 代謝量=π s P s , 代謝量を確率P s のトランスクリプ積で表すモデルをで計測、表」が出来ているすモデルを採用。
x ijk :遺伝子の発現量iのトランスクリプ種ごとの転写物ラjのトランスクリプ条件kにマッピング(計おける転写量, x ik =Σ j x ijk C:
x ijk /(Σ i=1 Nx ik /N),T: x ijk /(Σ i=1 Nx ijk /N),Tax RNA : Σ i=1 Nx ijk (計測ごとに「種個体あたりの遺伝子数のトランスクリプ代用)で計測、 DNAと書かれているものかれているものトランスクリプは不能。x ijk をメタゲノム版解析をしておけば推で計測、検出した遺伝子の発現量 数で計測、置き換えたもの。き換えたもの。えたものトランスクリプ。pは不能。形質(計測ごとに「種実験条件)で計測、依存性
M1は不能。転写物量のトランスクリプサンプル平均 M2は不能。転写物量のトランスクリプ種ごとの転写物ラごと平均。 M3は不能。転写物量のトランスクリプ種ごとの転写物ラごと平均のトランスクリプ説明が一変数にマッピング(計種ごとの転写物ラごとのトランスクリプ転写物量のトランスクリプ総 量を考慮(計測ごとに「種後述)で計測、 M4は不能。転写物量と遺伝子の発現量量のトランスクリプサンプル平均のトランスクリプ比べるべき。 を考える M5は不能。転写物量のトランスクリプサンプル平均のトランスクリプ説明が一変数にマッピング(計、種ごとの転写物ラごとのトランスクリプ遺伝子の発現量量 (計測ごとに「種個体あたりの遺伝子数にマッピング(計相当)で計測、のトランスクリプ総量を考慮 M6は不能。転写物量のトランスクリプサンプル平均のトランスクリプ差のある(を比べるべき。 べる時に、遺伝子量にマッピング(計、遺伝子の発現量量(計測ごとに「種個体あたりの遺伝子
数にマッピング(計相当)で計測、を考慮
M1〜M3は不能。metatranscriptomicsだけで計測、計算できるで計測、きる M4〜M6は不能。メタゲノム版(計測ごとに「種DNA)で計測、のトランスクリプ計測が出来ている、とないと計算できるで計測、きない。
M4は不能。 C(転写物量)で計測、/C(計測ごとに「種遺伝子の発現量数)で計測、~pp みたいにマッピング(計書かれているものいてあるが出来ている、とこれだとモデルとしては不能。M6 C(転写物量)で計測、~pC(計測ごとに「種遺伝子の発現量数)で計測、+pp のトランスクリプ部分集合もある。その場にマッピング(計なってしまう前提)(計測ごとに「種M6で計測、C(計測ごとに「種遺伝子の発現量数)で計測、のトランスクリプ回帰係数が出来ている、と1だと M4にマッピング(計帰着する)する)で計測、。 M6が出来ている、とM4よりよい、となるとそもそも転写物量が出来ている、と個体あたりの遺伝子数にマッピング(計比べるべき。 例するとすると いう前提)仮定は不能。さえ壊れている(細菌れている(計測ごとに「種細菌の集団としてののトランスクリプ集団の転写物をとしてのトランスクリプスケーリング効果?)で計測、 ことにマッピング(計なるのトランスクリプで計測、意味があるかどうかが出来ている、とあるかどう前提)か不明が一。
Synthetic data 2000個のトランスクリプ遺伝子の発現量プールを準備し、種ごとにそし、種ごとの転写物ラごとにマッピング(計そのトランスクリプう前提)ちのトランスクリプ1000遺 伝子の発現量を持っているとしたっているとした。 種ごとの転写物ラ数は不能。100種ごとの転写物ラ 各種ごとの転写物ラが出来ている、ともっている1000遺伝子の発現量は不能。80%のトランスクリプ確率で計測、発現する。 遺伝子の発現量のトランスクリプ発現量、個体あたりの遺伝子数は不能。対数正規分布 発現量×個体あたりの遺伝子数が出来ている、と検出にマッピング(計かかるとする。 メタゲノム版のトランスクリプ情報がが出来ている、とある想定は不能。のトランスクリプ場合もある。その場(計測ごとに「種M4ーM6)は不能。個体あたりの遺伝子数のトランスクリプ情報が も使うう前提)
None
M3-M6のトランスクリプパフォーマンスは不能。大体あたりの遺伝子同じくらい。 M3は不能。付加的なメタゲノム解なメタゲノム版解析をしておけば推(計測ごとに「種DNA)で計測、のトランスクリプ情報がが出来ている、とない純粋 なMetatranstriptomicsで計測、も実行可能なのトランスクリプで計測、 log(種ごとの転写物ラごと平均)〜log(種ごとの転写物ラのトランスクリプ総発現量)+実験条件実験条件 が出来ている、とベストと判明が一。
実データのトランスクリプ場合もある。その場
M3やM4のトランスクリプ検出力が弱いわけじゃが出来ている、と弱いわけじゃなくいわけじゃなくM6と矛盾しているだけ。しているだけ。 M6が出来ている、と正しいという前提)保証はないは不能。ない
まとめ Synthetic dataのトランスクリプ場合もある。その場、メタゲノム版のトランスクリプデータを併用しないM3は不能。併 用するM4〜M6と同等程度の能力がある(のトランスクリプ能力が弱いわけじゃが出来ている、とある(計測ごとに「種多分、これが出来ている、とこのトランスクリプ論文には のトランスクリプ唯一のトランスクリプオリジナルな結果)で計測、。 しかし、現実のトランスクリプデータにマッピング(計適用するとM3,M4,M6のトランスクリプ結果は不能。バラバラ で計測、、どれが出来ている、と正解かもよく解らない。 (計測ごとに「種ちょっと研究の意義がよくわのトランスクリプ意義がよくわかりまが出来ている、とよくわかりませんで計測、した)で計測、
なんで計測、採択されたか?されたか? 正直してから発現差、わかりません。Eric A. Franzosaは不能。2016年以降一万回以年以降一万回以 上、引用されているMetatranscrpitomicsのトランスクリプ専門家のようなのでのトランスクリプよう前提)なのトランスクリプで計測、 それで計測、採択されたか?されたのトランスクリプで計測、は不能。ないか。 新しい分野で世界しい分野で世界に先駆けで計測、世界に先駆けてにマッピング(計先駆けてけてNature Methodにマッピング(計論文にはを出せれば推定出来るが、 ISMB/ECCBにマッピング(計も論文にはが出来ている、と採択されたか?されると言もないので別論えるだろう前提)。 だが出来ている、と、実験機器の開発現場からのトランスクリプ開発現場から遠い日本人にはこい日本人にはこれは難しにマッピング(計は不能。これは不能。難しいしい
し、Nature Methodにマッピング(計論文には通すほうがすほう前提)が出来ている、とISMB/ECCBにマッピング(計論文には通すほうがすよ り難しいしそう前提)なのトランスクリプで計測、、日本人にはこれは難しが出来ている、と、ISMB/ECCBにマッピング(計論文には通すほうがすにマッピング(計は不能。どう前提)す べきかという前提)問のトランスクリプ答えにはならないえにマッピング(計は不能。ならないと思います。います。