Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テンソル分解を用いたマルチオミックスデータ解析法の医学への応用

 テンソル分解を用いたマルチオミックスデータ解析法の医学への応用

BioTech Japan 2018

「テンソル分解を用いたマルチオミックスデータ解析法の医学への応用」

概要:
マルチオミックスデータは近年安価に計測され大量に蓄積されているがその医学への応用は解析方法の困難さからすすんでいない。テンソル分解を用いた解析法を提案する。

発表日時: 6月27日 (水) 13:30 ~ 14:00
会場: ACA-5
http://d.bio-t.jp/ja/Expo/4301944/----

での講演内容です。

Y-h. Taguchi

June 29, 2018
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. 1 テンソル分解を用いたマルチオミックスデータ 解析法の医学への応用 中央大学理工学部物理学科 田口善弘

  2. 2 マルチオミックスデータの課題 → 多種類(遺伝子発現プロファイル、プロモーターメチル化、 miRNAなどの非コードRNA、ヒストン修飾、クロマチン構造、メ タボローム、プロテオーム)のオミックスデータを統合的に解析 して創薬やバイオマーカー探索に繋げられない。 → 困難の理由: ※ データ数が違う  miRNA:数千  mRNA:数万

     メチル化:数十万〜数百万  → 重み付けが難しい。 ※ 遺伝子選択に使うと数が多すぎたり少な過ぎたりする ※ どういう基準で選べばいいか不明    (患者vs健常者 かつ マルチオミックス間で相関、とか いうと条件を満たすものがなくなったりする)
  3. 3 そこで.... データ駆動型の研究が良い(データに語らせる) 特に僕は「教師なし学習」型の研究に注力している。 機械学習    →教師あり学習 ∋ 深層学習 深層学習    →強化学習 ∋ 深層学習 深層学習    →教師なし学習 ∌

    ∌ 深層学習 深層学習     → 階層的クラスタリング     → SOM     → KーMeans     → 主成分分析     → テンソル分解 テンソル分解 
  4. 4 「多様な強化学習の概念と課題認識」より https://www.slideshare.net/yukono1/ss-102843951 DeNAシステム本部AIシステム部AI研究開発グループ第二部 甲野祐

  5. 5 教師なし学習の利点 ※ 教師データ情報がないので、教師データ(往々にして人間 が主観でつける)の間違いに影響され用がない。 ※ 上記とほぼ同じことだが、強化学習や教師あり学習では問 題となる過学習が起きにくい。 ※ 繰り返しの学習プロセスが無いので計算が速い などなどの利点がある。 多種類の変数を扱うことができる三階以上のテンソルはマルチ オミックスデータを扱うのに適している。そこで今回はマルチオ

    ミックスデータをテンソル分解で解析することで教師なし学習 による医学データへ応用を目指す。
  6. 遺伝子発現×メチル化×人 人×特異値ベクトル 遺伝子発現 ×特異値ベクトル メチル化×特異値ベクトル テンソル コアテンソル 遺伝子発現×人 メチル化×人 テンソル分解とは?

  7. 人×特異値ベクトル クラス依存性のある特異値ベクトルの同定 コアテンソル 遺伝子発現 ×特異値ベクトル メチル化×特異値ベクトル 寄与の大きい コアテンソル成分の同定 対応する遺伝子発現 メチル化特異値ベクトルの同定

    遺伝子発現、メチル化からクラス 依存性に寄与するものを同定 テンソル分解を用いた変数選択
  8. 人工データによるデモンストレーション 50 50 1000 +20%ノイズ 50 100%ノイズ 無相関 無相関 +

    + 50 +20%ノイズ 50×1000 ×1000 テンソル テンソル分解
  9. x ik1 k 1 =1 1≦i 50 ≦ k 1

    =2 k 1 =3 x jk2 k 2 =1 k 2 =2 x lk2 k 3 =1 k 3 =2 1≦j 1000 ≦ 1≦l 1000 ≦ ヒト mRNA メチル化
  10. x j 3 i x j 1 j 2 j

    3 i =x j 1 j 2 i x j 3 i =G(l 1 ,l 2 ,l 3 ,l 4 )u l 1 j 1 u l 2 j 2 u l 3 j 3 u l 4 i x j 1 j 2 i u l 1 j 1 u l 2 j 2 u l 3 j 3 u l 4 i j 1 j 2 j 3 i compounds time points sample gene Gene X target 応用例1: 応用例1: 薬剤投与培養細胞 薬剤投与培養細胞× ×人疾患遺伝子発現 人疾患遺伝子発現 プロファイル統合解析 プロファイル統合解析
  11. None
  12. None
  13. SwissDockによる検証 Chrosisの場合 HnF4a vs Bezafibrate K i = 0.13μM

  14. CYPOR vs Bezafibrate K i = 79nM SwissDockによる検証 Chrosisの場合

  15. 「原発性胆汁性肝硬変に対するbezafibrate療法 の有効性と問題点」 肝臓 Vol. 46 (2005) No. 4 P 200-207

    原発性胆汁性肝硬変 (PBC) 26例, その他の胆道系酵素優位の 肝障害4例を対象にbezafibrateの投与を行い, その有効性と問題 点について検討した. s2-PBC1例を除くすべての症例でALPは bezafibrate投与1カ月後より低下し始め, 3カ月後には36〜78% の低下を認め, その有効性が確認された. また, UDCAの前投与 があった群においても相加的なALPの低下が認められ, 併用療法 が有効と考えられた. しかし, 黄疸を伴う症候性PBC3例中1例は 無効, 他の2例はtransaminaseの上昇を認めており, 投与の是非 は今後の課題と考えられた. さらに, 副作用はほとんどなく安全性 の高い薬剤と報告されているが, 我々の検討では黄疸を伴う症候 性PBC2例を含む6例にtransaminaseの上昇が, 高齢者の1例に 横紋筋融解症が認められ, このような症例においては特に慎重な 投与が必要と考えられた.
  16. Yin et al, “Systematic review and meta­analysis: bezafibrate in patients

    with primary biliary cirrhosis”, Drug Des Devel Ther. 2015 ;9:5407­19. CONCLUSION: Combination therapy improved liver biochemistry and the prognosis of PBC, but did not improve clinical symptoms or incidence of death. Attention should be paid to adverse events when using bezafibrate.
  17. mRNA サンプル1 サンプル2 サンプル3 サンプル4 サンプル5 miRNA A群 B群 アクティブ

    アクティブ 発現量 相互作用 x ij ×x il i:161サンプル, j:13393mRNA, l:755miRNA, (8群) 応用例2: 応用例2: 乳がん 乳がんmRNA mRNAプロファイルと プロファイルとmiRNA miRNAプロファイルの統合解析 プロファイルの統合解析
  18. 病態間で差があるx ik1 の選択 k 1 =1 k 1 =2 k

    1 =3 k 1 =4 k 1 =5 1≦k 1 5 ≦ に病態依存性がある P値
  19. k 2 k 3 k 1 G(k 1 ,k 2

    ,k 3 ) 1≦k 1 k 2 k 3 5 ≦ k 1 :サンプル k 2 :mRNA k 3 :miRNA 1≦ k 2 5 ≦ G大 G小 1≦ k 3 2 ≦ x jk2 x lk3 ガウス分布仮定 外れ値検出 Benjamini­Hochberg 補正P <0.01 χ二乗分布でP値 755miRNA中7miRNA 13393mRNA中427mRNA
  20. mRNA MSigDB → による評価 →多数の乳がん関連サンプルにおいて異常発現している遺伝子 と有意にオーバーラップ SMID BREAST CANCER BREAST

    CANCER LUMINAL B DN SMID BREAST CANCER BREAST CANCER BASAL DN DOANE BREAST CANCER BREAST CANCER ESR1 UP SMID BREAST CANCER BREAST CANCER RELAPSE IN BONE DN SMID BREAST CANCER BREAST CANCER NORMAL LIKE UP FARMER BREAST CANCER BREAST CANCER BASAL VS LULMINAL BREAST CANCER BREAST CANCER UP SMID BREAST CANCER BREAST CANCER BASAL UP SMID BREAST CANCER BREAST CANCER LUMINAL B UP TURASHVILI BREAST DUCTAL CARCINOMA BREAST DUCTAL CARCINOMA VS DUCTAL NORMAL DN
  21. miRNA → Diana­mirpath による評価

  22. 22 ## $mRNA ## [1] 150 200 ## ## $miRNA

    ## [1] 150 184 ## ## $proteomics ## [1] 150 142 ## Basal Her2 LumA ## 45 30 75 応用例3: 応用例3: mRNA mRNA・ ・miRNA miRNAプロファイルとプロテオームの統合解析 プロファイルとプロテオームの統合解析 x ij :i番目のmRNAのj番目のサンプルでの発現量 x kj :k番目のmiRNAのj番目のサンプルでの発現量 x lj :l番目のタンパクのj番目のサンプルでの発現量 テンソル:x iklj =x ij ・x kj ・x lj テンソルをテンソル分解する (著名なマルチオミックス解析ソフトで あるmixOmixでのテストデータ)
  23. 23 u 1j u 4j Basal Her2 LumA Basal 42

    42 4 0 Her2 2 25 25 2 LumA 1 1 73 73 予 測 実際 誤差6.5% 判別分析
  24. 24 ヒートマップ Basal Her2 LumA mRNA miRNA protein 利点: ラベルなし教師なし

    学習なのでミスラベ ルにも強く、ロバスト ネスも高い。
  25. 25 おわりに テンソル分解を用いた教師なし学習による変数選択 をマルチオミックス解析にに応用し、遺伝子発現プロ ファイルからのAI創薬、mRNA/miRNAの統合解析 による乳がん原因遺伝子の推定、mRNA/miRNA/プ ロテオームの統合解析によるバイオマーカー探索を 行った。 本技術を活用した共同研究を希望します。