Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ISMB/ECCB 2019読み会:ShaKer: RNA SHAPE prediction ...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
satoken
August 21, 2019
Science
250
0
Share
ISMB/ECCB 2019読み会:ShaKer: RNA SHAPE prediction using graph kernel
satoken
August 21, 2019
Other Decks in Science
See All in Science
AIによる科学の加速: 各領域での革新と共創の未来
masayamoriofficial
0
580
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
PRO
0
110
知能とはなにかーヒトとAIのあいだー
tagtag
PRO
0
210
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
740
なぜエネルギーは保存する? 〜自由落下でわかる“対称性”とネーターの定理〜
syotasasaki593876
0
170
なぜ21は素因数分解されないのか? - Shorのアルゴリズムの現在と壁
daimurat
0
430
会社でMLモデルを作るとは @電気通信大学 データアントレプレナーフェロープログラム
yuto16
1
700
中央大学AI・データサイエンスセンター 2025年第6回イブニングセミナー 『知能とはなにか ヒトとAIのあいだ』
tagtag
PRO
0
160
AIPシンポジウム 2025年度 成果報告会 「因果推論チーム」
sshimizu2006
3
510
My Little Monster
juzishuu
0
700
因果推論と機械学習
sshimizu2006
1
1.2k
Tensor Factorization Meets Deformed Information Geometry: Convex Relaxation under Deformed Algebra
gkazunii
0
110
Featured
See All Featured
Believing is Seeing
oripsolob
1
140
How to build a perfect <img>
jonoalderson
1
5.5k
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Unsuck your backbone
ammeep
672
58k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
65
55k
Optimising Largest Contentful Paint
csswizardry
37
3.7k
How to Ace a Technical Interview
jacobian
281
24k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.2k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
240
How GitHub (no longer) Works
holman
316
150k
Transcript
ISMB/ECCB 2019読み会 慶應義塾大学理工学部 佐藤健吾
概要 • Graph Kernelを用いて、RNA配列のみからSHAPE reactivityを予測 する。
SHAPE修飾によるRNA構造決定 [Smola et al. 2015] (selective 2’-hydroxyl acylation analyzed by
primer extension)
[Smola et al. 2015]
Graph Kernelによる特徴抽出 • Neighborhood Subgraph Pairwise Distance Kernel (NSPDK) •
半径 r の部分構造 Av , Bu が距離 d でグラフGに存在するか? • GraphClust [Heyne et al, 2012] や GraphProt [Maticzka et al, 2014] でも RNAの特徴抽出で使用している [Costa et al, 2010] r = 1 d = 5 r = 3 d = 5 r = 5 d = 5
学習 • Gradient Tree Boostingによる回帰モデルの学習
予測 • RNAsuboptを用いてRNA配列の二次構造をm個サンプリングする。 • それぞれの二次構造と配列を学習した回帰モデルに入力し、 SHAPE reactivityを予測する。 • m個の予測の平均を最終的な予測とする。
データセット • テストセット • 公共データ (Deigan et al., 2009; Hajdin
et al., 2013; Montaseri et al., 2017) (ほとんどの配列は二次構造未知) • 学習セット • 上記データに含まれるRibosomal RNA配列(二次構造既知)
比較手法 • [Sükösd et al, 2013]の手法 • 構造既知のRNA配列におけるSHAPE reactivityの確率分布を各塩基のペア リング状況ごとに推定(unpaired,
helix-end, stacked) • 構造既知配列にしか使えない。
実験結果:アクセシビリティ • RNAplfold + SHAPE値でアクセシビリティを予測 • 真のSHAPE値による予測と推定SHAPE値による予測のランク相関 Sükösd et al
+ref. stru. ShaKer + ref. stru. trivial ShaKer SHAPEなし ShaKerによる予測SHAPE値 0.861 ± 0.17 SHAPEなし 0.839 ± 0.16
実験結果:塩基対確率 • 既知二次構造に含まれる塩基対の塩基対確率の平均 Sükösd et al +ref. stru. ShaKer +
ref. stru. wetlab SHAPE ShaKer SHAPE なし ShaKerによる予測SHAPE値 0.679 ± 0.26 SHAPEなし 0.629 ± 0.21
実験結果:二次構造情報は重要か? • 二次構造情報を使わずに一次構造(配列)のみでNSPDKを構成 した場合(Unstructured)
なぜISMB/ECCBに採択されたか? • これまでの実績 • GraphClustやGraphProtなどで使われている手法NSPDKを使っている。 • (RNA界の巨匠Prof. Rolf Backofen) •
問題設定 • SHAPE値をRNA配列のみから予測する手法はこれまでにない。 • 精度 • 本手法で予測したSHAPE値がRNA二次構造予測の精度向上に貢献してい る。
微妙なところ • “RNA SHAPE prediction” というタイトルにも関わらず、SHAPE値 の回帰については直接評価していない。 • 比較手法 [Sükösd
et al, 2013]との比較がフェアでない。 • 予測を使って予測する(配列 → SHAPE値 → 二次構造)よりは、 直接予測する(配列 → 二次構造)方が手法としては筋が良さそ う。 ContextFold や mxfoldのような Rich parametrization • そもそもSHAPE値を予測することに意味があるのか?