Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ISMB/ECCB 2019読み会:ShaKer: RNA SHAPE prediction using graph kernel

satoken
August 21, 2019

ISMB/ECCB 2019読み会:ShaKer: RNA SHAPE prediction using graph kernel

satoken

August 21, 2019
Tweet

Other Decks in Science

Transcript

  1. Graph Kernelによる特徴抽出 • Neighborhood Subgraph Pairwise Distance Kernel (NSPDK) •

    半径 r の部分構造 Av , Bu が距離 d でグラフGに存在するか? • GraphClust [Heyne et al, 2012] や GraphProt [Maticzka et al, 2014] でも RNAの特徴抽出で使用している [Costa et al, 2010] r = 1 d = 5 r = 3 d = 5 r = 5 d = 5
  2. データセット • テストセット • 公共データ (Deigan et al., 2009; Hajdin

    et al., 2013; Montaseri et al., 2017) (ほとんどの配列は二次構造未知) • 学習セット • 上記データに含まれるRibosomal RNA配列(二次構造既知)
  3. 実験結果:塩基対確率 • 既知二次構造に含まれる塩基対の塩基対確率の平均 Sükösd et al +ref. stru. ShaKer +

    ref. stru. wetlab SHAPE ShaKer SHAPE なし ShaKerによる予測SHAPE値 0.679 ± 0.26 SHAPEなし 0.629 ± 0.21
  4. なぜISMB/ECCBに採択されたか? • これまでの実績 • GraphClustやGraphProtなどで使われている手法NSPDKを使っている。 • (RNA界の巨匠Prof. Rolf Backofen) •

    問題設定 • SHAPE値をRNA配列のみから予測する手法はこれまでにない。 • 精度 • 本手法で予測したSHAPE値がRNA二次構造予測の精度向上に貢献してい る。
  5. 微妙なところ • “RNA SHAPE prediction” というタイトルにも関わらず、SHAPE値 の回帰については直接評価していない。 • 比較手法 [Sükösd

    et al, 2013]との比較がフェアでない。 • 予測を使って予測する(配列 → SHAPE値 → 二次構造)よりは、 直接予測する(配列 → 二次構造)方が手法としては筋が良さそ う。 ContextFold や mxfoldのような Rich parametrization • そもそもSHAPE値を予測することに意味があるのか?