Slide 1

Slide 1 text

SIGBIO64 1 テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法によ変数選択法によるによる変数選択法によ miRNA/mRNA/プロテオームの統合解析の統合解析統合解を用いた教師無析 中央大学物理学科 田口善弘 第64回バイオ情報学研バイオ情報学研究会 https://doi.org/10.1007/978-3-030-26763-6_54 https://doi.org/10.1101/591867

Slide 2

Slide 2 text

SIGBIO64 2 特異値分解を用いた教師無 xij N M (uli)T N L vlj L M ⨉ ≈ x ij ≃∑ l=1 L u li λl v l j L L ⨉ λl N: 遺伝子総数 (i) M: サンプル分解を用いた教数 (j) xij: 遺伝子発現 例

Slide 3

Slide 3 text

SIGBIO64 3 解を用いた教師無釈….. j:サンプル 健常者 患者 vlj i:遺伝子 uli DEG: Differentially Expressed Genes 発現差のある遺伝子の統合解析ある変数選択法によ遺伝子 とある変数選択法によ l 健常者 < 患者 DEG: DEG: 健常者 > 患者

Slide 4

Slide 4 text

SIGBIO64 4 x ijk G u l1i u l2j u l3k L1 L2 L3 HOSVD (Higher Order Singular Value Decomposition) テンソル分解を用いた教に拡張….. N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k N: 遺伝子数 (i) M: サンプル分解を用いた教数 (j) K: 臓器数 (k) xijk: 遺伝子 例

Slide 5

Slide 5 text

SIGBIO64 5 解を用いた教師無釈….. j:サンプル 健常者 患者 ul2j とある変数選択法によ l2 とある変数選択法によ l3 k:臓器 臓器特異的な発現な発現発現 ul3k

Slide 6

Slide 6 text

SIGBIO64 6 i:genes ul1i tDEG: tissue specific Differentially Expressed Genes 臓器特異的な発現に発現差のある遺伝子がある変数選択法によ遺伝子 健常者 < 患者 tDEG: tDEG: 健常者 > 患者 とある変数選択法によ l1 が |G(l1l2l3)|最大である変数選択法によとする変数選択法によ If G(l1l2l3)>0 固定

Slide 7

Slide 7 text

SIGBIO64 7 複数の統合解析行列またはテンソルまた教師無し学習にはテンソルの統合テンソル分解を用いた教の統合解析統合解を用いた教師無析 xij : サンプル分解を用いた教jの統合解析遺伝子iの統合解析発現量 xkj: サンプル分解を用いた教jの統合解析領域 kの統合解析メチル分解を用いた教化 x xijk ijk ≡ ≡ x xij ij ⨉ ⨉ x xkj kj G u l1i u l2j u l3k L1 L2 L3 x ijk N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k

Slide 8

Slide 8 text

SIGBIO64 8 解を用いた教師無釈….. j:サンプル 健常者 患者 ul2j とある変数選択法によ l2

Slide 9

Slide 9 text

SIGBIO64 9 i:genes ul1i DEG: Differentially Expressed Genes 発現差のある遺伝子の統合解析ある変数選択法によ遺伝子 健常者 < 患者 DEG: DEG: 健常者 > 患者 If G(l1l2l3)>0 遺伝子発現 とある変数選択法によ l1, l3 で |G(l1l2l3)|が最大の統合解析時 固定

Slide 10

Slide 10 text

SIGBIO64 10 k:regions ul3k DMR: Differentially Methylated Regions メチル分解を用いた教化に差のある遺伝子がある変数選択法によ領域 健常者 < 患者 DMR: DMR: 健常者 > 患者 メチル分解を用いた教化

Slide 11

Slide 11 text

SIGBIO64 11 マル分解を用いた教チオミックス解析解を用いた教師無析

Slide 12

Slide 12 text

SIGBIO64 12 ## $mRNA ## [1] 150 サンプル分解を用いた教 ⨉ 200 mRNAs ## ## $miRNA ## [1] 150 サンプル ⨉184 miRNAs ## ## $proteomics ## [1] 150 サンプル ⨉142 プロテイン 3種類の培養細胞の統合解析培養細胞 ## Basal Her2 LumA ## 45 30 75 bioconductorの統合解析mixOmics packageの統合解析例を用いた教師無し使う。 う。 https://bioconductor.org/packages/release/bioc/html/ mixOmics.html

Slide 13

Slide 13 text

SIGBIO64 13 x ij :j番目のサンプルののサンプルのサンプルのサンプルのi番目のサンプルののサンプルのmRNA のサンプルの発現量 x kj :j番目のサンプルののサンプルのサンプルのサンプルのk番目のサンプルののサンプルのmiRNAのサンプルの発現量 x pj :j番目のサンプルののサンプルのサンプルのサンプルのp番目のサンプルののサンプルのタンパクの発現量のサンプルの発現量 テンソル:x ikpj =x ij・x kj・x pj テンソル分解を適用を適用適用 x ikpj ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 ∑ l 4 =1 L 4 G (l 1 l 2 l 3 l 4 )u l 1 i u l 2 k u l 3 p u l 4 j ul1i: mRNA, ul2k: miRNA ul3p: プロテオームの統合解析, ul4j: サンプル分解を用いた教

Slide 14

Slide 14 text

SIGBIO64 14 u 1j u 4j Basal Her2 LumA Basal 42 42 4 0 Her2 2 25 25 2 LumA 1 1 73 73 予想 現実 誤差 6.5% 線形判別 LOOCV

Slide 15

Slide 15 text

SIGBIO64 15 絶対値の統合解析小さい順に さい順に に |G(l1,l2,l3,l4)| l4=1,4を用いた教師無し並べるべる変数選択法によ 1 ≦ l3 ≦ 4, プロテオーム 1 ≦ l1 ≦ 2, mRNA 1 ≦ l2 ≦ 2, miRNA

Slide 16

Slide 16 text

SIGBIO64 16 選択し学習による変数た教師無し学習に特異値ベクト ル分解を用いた教の統合解析2乗和が大きい順乗和が大きい順が大きい順に に10個の 個の の統合解析 mRNAsと miRNAs とタンパクを用いた教師無し選 択。3つの統合解析培養細胞を用いた教師無し別 けられる変数選択法によかを用いた教師無し見た。た教師無し学習に。

Slide 17

Slide 17 text

SIGBIO64 17 Basal Her2 LumA mRNA miRNA protein ヒートマップ:行:培養細胞、行:行:培養細胞、培養細胞、列またはテンソル:行:培養細胞、選択された教師無し学習に変数

Slide 18

Slide 18 text

SIGBIO64 18 判別に使う。 用いた教師無し学し学習による変数た教師無し学習に生成変数の統合解析数 誤差のある遺伝子 0.05 0.10 0.15 DIABLOが生成し学習による変数た教師無し学習に変数での統合解析判別能力 DIABLO DIABLO と比較 と比較

Slide 19

Slide 19 text

SIGBIO64 19 ヒートマップ:行:培養細胞、 行:行:培養細胞、培養細胞 列またはテンソル:行:培養細胞、選択された教師無し学習に変数

Slide 20

Slide 20 text

SIGBIO64 20 テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師な発現し学習による変数学習による変数選択による変数選択法によ変数選択 の統合解析利点と欠点と欠点と欠点 利点と欠点 利点と欠点: : 高速(最適化し学習による変数な発現いから) ロバス解析ト (ラベル分解を用いた教情報フリー) 教師な発現し学習による変数 (モデル分解を用いた教設計不要) 欠点と欠点:行:培養細胞、 欠点と欠点:行:培養細胞、 うまく行かなかったら行かな発現かった教師無し学習にらおわり メモリーを用いた教師無し食う。う。 150 ⨉ (200+184+142) vs 150 ⨉ 200 ⨉ 184 ⨉ 142