Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Statistical approaches for differential express...
Search
Y-h. Taguchi
August 25, 2021
Science
0
230
Statistical approaches for differential expression analysis in metatranscriptomics
ISMB/ECCB2021読み会
https://connpass.com/event/221002/
2021/8/30 14:00ー18:00
Y-h. Taguchi
August 25, 2021
Tweet
Share
More Decks by Y-h. Taguchi
See All by Y-h. Taguchi
テンソル分解による糖尿病の組織特異的遺伝子発現の統合解析を用いた関連疾患の予測
tagtag
2
130
マウス肝炎ウイルス感染の遺伝子発現へのテンソル分解の適用によるSARS-CoV-2感染関連重要ヒト遺伝子と有効な薬剤の同定
tagtag
0
95
大学のアウトリーチ活動(中央大学学員(OB)会主催学術講演で講演して)
tagtag
1
61
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
0
100
マルチオミクスデータ解析のためのカーネルテンソル分解による新しい特徴選択法
tagtag
1
100
学術講演会中央大学学員会大分支部
tagtag
0
140
学術講演会中央大学学員会いわき支部
tagtag
0
150
テンソル分解を用いた教師なし学習による変数選択法のシングルセルマルチオミックスデータ解析への応用
tagtag
1
150
学術講演会中央大学学員会八王子支部
tagtag
0
290
Other Decks in Science
See All in Science
Ignite の1年間の軌跡
ktombow
0
110
白金鉱業Meetup Vol.15 DMLによる条件付処置効果の推定_sotaroIZUMI_20240919
brainpadpr
2
760
【健康&筋肉と生産性向上の関連性】 【Google Cloudを企業で運用する際の知識】 をお届け
yasumuusan
0
530
点群ライブラリPDALをGoogleColabにて実行する方法の紹介
kentaitakura
1
170
Planted Clique Conjectures are Equivalent
nobushimi
0
140
Factorized Diffusion: Perceptual Illusions by Noise Decomposition
tomoaki0705
0
370
システム数理と応用分野の未来を切り拓くロードマップ・エンターテインメント(スポーツ)への応用 / Applied mathematics for sports entertainment
konakalab
1
280
Causal discovery based on non-Gaussianity and nonlinearity
sshimizu2006
0
260
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
170
証明支援系LEANに入門しよう
unaoya
0
850
02_西村訓弘_プログラムディレクター_人口減少を機にひらく未来社会.pdf
sip3ristex
0
310
構造設計のための3D生成AI-最新の取り組みと今後の展開-
kojinishiguchi
1
1.1k
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
349
20k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
41
2.3k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
45
7.2k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Mobile First: as difficult as doing things right
swwweet
223
9.6k
Rebuilding a faster, lazier Slack
samanthasiow
81
9k
Designing for humans not robots
tammielis
253
25k
The Cost Of JavaScript in 2023
addyosmani
49
7.8k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.7k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
770
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
What's in a price? How to price your products and services
michaelherold
245
12k
Transcript
Bioinformatics, 37, 2021, i34–i41 doi: 10.1093/bioinformatics/btab327 ISMB/ECCB 2021 Statistical approaches
for differential expression analysis in metatranscriptomics Yancong Zhang, Kelsey N. Thompson , Curtis Huttenhower and Eric A. Franzosa
Metatranscriptomics = Metagenomeのトランスクリプトランスクリプトーム版版 微生物集団の転写物をのトランスクリプ転写物をHTS(high throughput sequencing)で計測、で計測、計測、 種ごとの転写物ラごとのトランスクリプ転写物ライブラリにマッピング(計マッピング(計測ごとに「種計測ごとにマッピング(計「種種ごとの転写物ラ×転写物量 のトランスクリプ表」が出来ている」が出来ている、と出来ている、というている、という前提)前提)で計測、 問題点: 転写物のトランスクリプ量=一個体あたりの遺伝子あたりのトランスクリプ遺伝子の発現量のトランスクリプ発現量(A)×個体あたりの遺伝子数(B)
なのトランスクリプで計測、(A)と(B)を分離できないと発現で計測、きないと発現差のある(のトランスクリプある(計測ごとに「種A)で計測、のトランスクリプ同定は不能。は不能。不能。 発現差のある(が出来ている、とあるかどう前提)は不能。(A)で計測、比べるべき。 べるべき。 (B)は不能。別途、メタゲノム版解析をしておけば推をしておけば推定出来るが、推定は不能。出来ている、というるが出来ている、と、そのトランスクリプ情報がが出来ている、と 無い場合もある。い場合もある。その場もある。そのトランスクリプ場合もある。その場どう前提)すれば推定出来るが、いいか?
Work flow for taxon- specific normalization. (PeerJ, 2017年 http://dx.doi.org/10.7717/ peerj.3859)
このトランスクリプ論文にはにマッピング(計は不能。taxon-specific normalizationのトランスクリプ説明が一が出来ている、と一 言もないので別論もないのトランスクリプで計測、別論文にはから 引用。 種ごとの転写物ラごとにマッピング(計RNA量を 規格化した後、遺伝子した後、遺伝子の発現量ごと にマッピング(計足し直してから発し直してから発現差してから発現差のある(が出来ている、と あると遺伝子の発現量を探す、といす、とい う前提)方法(計測ごとに「種黄と青が別種。濃と青が別種。濃が出来ている、と別種ごとの転写物ラ。濃 淡が遺伝子の種類が出来ている、と遺伝子の発現量のトランスクリプ種ごとの転写物ラ類)で計測、。 条件1 条件2 種ごとの転写物ラ2 種ごとの転写物ラ1 種ごとの転写物ラ1 種ごとの転写物ラ2 種ごとの転写物ラ1 種ごとの転写物ラ2 遺 伝 子の発現量 5 種ごとの転写物ラ 類 発 現 差のある( あ り
モデル: log(計測ごとに「種代謝量)で計測、〜(計測ごとに「種カテゴリ変数:実験条件)で計測、 代謝量=π s P s , 代謝量を確率P s のトランスクリプ積で表すモデルをで計測、表」が出来ているすモデルを採用。
x ijk :遺伝子の発現量iのトランスクリプ種ごとの転写物ラjのトランスクリプ条件kにマッピング(計おける転写量, x ik =Σ j x ijk C:
x ijk /(Σ i=1 Nx ik /N),T: x ijk /(Σ i=1 Nx ijk /N),Tax RNA : Σ i=1 Nx ijk (計測ごとに「種個体あたりの遺伝子数のトランスクリプ代用)で計測、 DNAと書かれているものかれているものトランスクリプは不能。x ijk をメタゲノム版解析をしておけば推で計測、検出した遺伝子の発現量 数で計測、置き換えたもの。き換えたもの。えたものトランスクリプ。pは不能。形質(計測ごとに「種実験条件)で計測、依存性
M1は不能。転写物量のトランスクリプサンプル平均 M2は不能。転写物量のトランスクリプ種ごとの転写物ラごと平均。 M3は不能。転写物量のトランスクリプ種ごとの転写物ラごと平均のトランスクリプ説明が一変数にマッピング(計種ごとの転写物ラごとのトランスクリプ転写物量のトランスクリプ総 量を考慮(計測ごとに「種後述)で計測、 M4は不能。転写物量と遺伝子の発現量量のトランスクリプサンプル平均のトランスクリプ比べるべき。 を考える M5は不能。転写物量のトランスクリプサンプル平均のトランスクリプ説明が一変数にマッピング(計、種ごとの転写物ラごとのトランスクリプ遺伝子の発現量量 (計測ごとに「種個体あたりの遺伝子数にマッピング(計相当)で計測、のトランスクリプ総量を考慮 M6は不能。転写物量のトランスクリプサンプル平均のトランスクリプ差のある(を比べるべき。 べる時に、遺伝子量にマッピング(計、遺伝子の発現量量(計測ごとに「種個体あたりの遺伝子
数にマッピング(計相当)で計測、を考慮
M1〜M3は不能。metatranscriptomicsだけで計測、計算できるで計測、きる M4〜M6は不能。メタゲノム版(計測ごとに「種DNA)で計測、のトランスクリプ計測が出来ている、とないと計算できるで計測、きない。
M4は不能。 C(転写物量)で計測、/C(計測ごとに「種遺伝子の発現量数)で計測、~pp みたいにマッピング(計書かれているものいてあるが出来ている、とこれだとモデルとしては不能。M6 C(転写物量)で計測、~pC(計測ごとに「種遺伝子の発現量数)で計測、+pp のトランスクリプ部分集合もある。その場にマッピング(計なってしまう前提)(計測ごとに「種M6で計測、C(計測ごとに「種遺伝子の発現量数)で計測、のトランスクリプ回帰係数が出来ている、と1だと M4にマッピング(計帰着する)する)で計測、。 M6が出来ている、とM4よりよい、となるとそもそも転写物量が出来ている、と個体あたりの遺伝子数にマッピング(計比べるべき。 例するとすると いう前提)仮定は不能。さえ壊れている(細菌れている(計測ごとに「種細菌の集団としてののトランスクリプ集団の転写物をとしてのトランスクリプスケーリング効果?)で計測、 ことにマッピング(計なるのトランスクリプで計測、意味があるかどうかが出来ている、とあるかどう前提)か不明が一。
Synthetic data 2000個のトランスクリプ遺伝子の発現量プールを準備し、種ごとにそし、種ごとの転写物ラごとにマッピング(計そのトランスクリプう前提)ちのトランスクリプ1000遺 伝子の発現量を持っているとしたっているとした。 種ごとの転写物ラ数は不能。100種ごとの転写物ラ 各種ごとの転写物ラが出来ている、ともっている1000遺伝子の発現量は不能。80%のトランスクリプ確率で計測、発現する。 遺伝子の発現量のトランスクリプ発現量、個体あたりの遺伝子数は不能。対数正規分布 発現量×個体あたりの遺伝子数が出来ている、と検出にマッピング(計かかるとする。 メタゲノム版のトランスクリプ情報がが出来ている、とある想定は不能。のトランスクリプ場合もある。その場(計測ごとに「種M4ーM6)は不能。個体あたりの遺伝子数のトランスクリプ情報が も使うう前提)
None
M3-M6のトランスクリプパフォーマンスは不能。大体あたりの遺伝子同じくらい。 M3は不能。付加的なメタゲノム解なメタゲノム版解析をしておけば推(計測ごとに「種DNA)で計測、のトランスクリプ情報がが出来ている、とない純粋 なMetatranstriptomicsで計測、も実行可能なのトランスクリプで計測、 log(種ごとの転写物ラごと平均)〜log(種ごとの転写物ラのトランスクリプ総発現量)+実験条件実験条件 が出来ている、とベストと判明が一。
実データのトランスクリプ場合もある。その場
M3やM4のトランスクリプ検出力が弱いわけじゃが出来ている、と弱いわけじゃなくいわけじゃなくM6と矛盾しているだけ。しているだけ。 M6が出来ている、と正しいという前提)保証はないは不能。ない
まとめ Synthetic dataのトランスクリプ場合もある。その場、メタゲノム版のトランスクリプデータを併用しないM3は不能。併 用するM4〜M6と同等程度の能力がある(のトランスクリプ能力が弱いわけじゃが出来ている、とある(計測ごとに「種多分、これが出来ている、とこのトランスクリプ論文には のトランスクリプ唯一のトランスクリプオリジナルな結果)で計測、。 しかし、現実のトランスクリプデータにマッピング(計適用するとM3,M4,M6のトランスクリプ結果は不能。バラバラ で計測、、どれが出来ている、と正解かもよく解らない。 (計測ごとに「種ちょっと研究の意義がよくわのトランスクリプ意義がよくわかりまが出来ている、とよくわかりませんで計測、した)で計測、
なんで計測、採択されたか?されたか? 正直してから発現差、わかりません。Eric A. Franzosaは不能。2016年以降一万回以年以降一万回以 上、引用されているMetatranscrpitomicsのトランスクリプ専門家のようなのでのトランスクリプよう前提)なのトランスクリプで計測、 それで計測、採択されたか?されたのトランスクリプで計測、は不能。ないか。 新しい分野で世界しい分野で世界に先駆けで計測、世界に先駆けてにマッピング(計先駆けてけてNature Methodにマッピング(計論文にはを出せれば推定出来るが、 ISMB/ECCBにマッピング(計も論文にはが出来ている、と採択されたか?されると言もないので別論えるだろう前提)。 だが出来ている、と、実験機器の開発現場からのトランスクリプ開発現場から遠い日本人にはこい日本人にはこれは難しにマッピング(計は不能。これは不能。難しいしい
し、Nature Methodにマッピング(計論文には通すほうがすほう前提)が出来ている、とISMB/ECCBにマッピング(計論文には通すほうがすよ り難しいしそう前提)なのトランスクリプで計測、、日本人にはこれは難しが出来ている、と、ISMB/ECCBにマッピング(計論文には通すほうがすにマッピング(計は不能。どう前提)す べきかという前提)問のトランスクリプ答えにはならないえにマッピング(計は不能。ならないと思います。います。