Upgrade to Pro — share decks privately, control downloads, hide ads and more …

テンソル分解を用いた教師なし学習による変数選択法の前立腺がんマルチオミックスデータ解析への応用

 テンソル分解を用いた教師なし学習による変数選択法の前立腺がんマルチオミックスデータ解析への応用

Presentation at SIGBIO70
http://www.ipsj.or.jp/kenkyukai/event/mps138bio70.html
2022/6/29

Y-h. Taguchi

June 25, 2022
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. SIGBIO70 3 テンソル分解を用いた教分解を用いた教師なとは? いろいろある変数選択法が、本研究ではタッ本研究ではタッカー分ではタ解析への応用ッカー分解を用いた教師なby HOSVD(higher order singular value decomposition)がベストという経験則という経験則経験則 x

    ijk = G(l 1 l 2 l 3 ) u l1j u l3i u l2k x ijk =∑ l 1 =1 N ∑ l 2 =1 M ∑ l 3 =1 K G(l 1 l 2 l 3 )u l 1 j u l 2 k u l 3 i x ijk ∈ℝN×M×K G(l 1 l 2 l 3 )∈ℝN×M ×K u l 1 j ∈ℝM ×M ,u l 2 k ∈ℝK×K , u l 3 i ∈ℝN ×N 直交行列
  2. SIGBIO70 4 Synthetic Data 4 4 4 5 5 5

    6 6 6 4 4 4 5 5 5 6 6 6 4 4 4 5 5 5 6 6 6 8 8 8 10 10 10 12 12 12 8 8 8 10 10 10 12 12 12 8 8 8 10 10 10 12 12 12 12 12 12 15 15 15 18 18 18 12 12 12 15 15 15 18 18 18 12 12 12 15 15 15 18 18 18 × j k 100回やって平均や発現量無しって平均平均 5
  3. SIGBIO70 10 Random Forest 3×3の前立腺がんマル9クラス問題としクラス問題として解析とし学習による変数て平均解を用いた教師な析への応用 100,000個の変数の内、平の前立腺がんマル変数の前立腺がんマル内、本研究ではタッ平均で8456個が非ゼロの個の変数の内、平が非ゼロのゼロの前立腺がんマル importance(判別に使われたといに使われたというこわれた教師なし学習にという経験則こと)を用いた教師なし持っていた。10って平均いた教師なし学習に。10 0こに比べて平均多すぎる変数選択法判別に使われたとい能は悪く9は悪く9く9クラス問題とし×9クラス問題とし=81サンプル分解を用いた教の前立腺がんマル う経験則ち、本研究ではタッ平均で16個が非ゼロの個の変数の内、平し学習による変数か正しく9クラス正し学習による変数く9クラス問題としクラスに分類できなかった。できなか正しく9クラスった教師なし学習に。 一方が有名)で上位100変数に限ったとしても、った教師なし学習にとし学習による変数て平均も、本研究ではタッ平均で73変数し学習による変数

    か正しく9クラス選択されず、本研究ではタッテンソル分解を用いた教分解を用いた教師なは愚かカテゴリ回帰か正しく9クラスカテゴリ回帰(一般には回やって平均帰にも惨 敗していた。し学習による変数て平均いた教師なし学習に。
  4. SIGBIO70 11 Penalized liner regression analysis (LDA) LASSOの前立腺がんマルカテゴリ回帰(一般には判別に使われたといバージョン 100%正解というロバ成功(判別に使われたとい率は84%は84%正解というロバ)。 但しし学習による変数L

    1 -normの前立腺がんマル係数λを用いた教師なし「正しく」選ぶ(正し学習による変数く」選ぶ(選ぶ(λ=0.01)必要 があり、本研究ではタッ答えを知らないとえを用いた教師なし知らないと選ぶすらないと選ぶすべがない。λを用いた教師なし0.02 にする変数選択法ともう経験則100変数中、本研究ではタッ9クラス問題とし変数し学習による変数か正しく9クラス選ばれなくな り、本研究ではタッ0.03や発現量無し0.04にする変数選択法ともう経験則全く駄目(一個もく駄目(一個の変数の内、平も正し学習による変数く 選ばれない)なの前立腺がんマルでロバストという経験則ネスがなさすぎる変数選択法
  5. SIGBIO70 21 |G(121l 4 )| l 4 l 4 =8

    u 8i がガウス分布 (帰無し仮説)
  6. SIGBIO70 30 Penalized liner regression analysis (LDA) LASSOの前立腺がんマルカテゴリ回帰(一般には判別に使われたといバージョン 1クラスに1サンプル分解を用いた教し学習による変数か正しく9クラス無しい場合は、単純にが含む。まれて平均いる変数選択法 (8カテゴリ回帰(一般には中半数の前立腺がんマル4カテゴリ回帰(一般にはが1サンプル分解を用いた教)。 

    LDAを用いた教師なし行う経験則にはカテゴリ回帰(一般には内分散が計算できる必が計算してできる変数選択法必要 がある変数選択法の前立腺がんマルでそもそもこの前立腺がんマル方が有名)法は適用いた教師なし学不可能は悪く9だった教師なし学習に。
  7. SIGBIO70 39 結論 テンソル分解を用いた教分解を用いた教師なを用いた教師なし使われたというこえば、本研究ではタッメチル分解を用いた教化や発現量無しも遺伝子発現プロファイル分解を用いた教も 入っていないマルって平均いないマル分解を用いた教チオミックスシーケンシングデータ解析への応用か正しく9クラスらでも、本研究ではタッ 使われたというこって平均いる変数選択法問題として解析(前立腺がんマルチオミがんマルチオミック)や発現量無し観測量(転写因子)を用いた教師なし再現する変数選択法 よう経験則な遺伝子選択が可能は悪く9である変数選択法。 し学習による変数か正しく9クラスし学習による変数、本研究ではタッ他の(伝統的な)の前立腺がんマルSOTAでは全く駄目(一個もく出てくるわけはな来る。なか正しく9クラスった教師なし学習に。 テンソル分解を用いた教分解を用いた教師なはマル分解を用いた教チオミックス解を用いた教師な析への応用の前立腺がんマル有効な手法としてもな手法とし学習による変数て平均もっと 活用いた教師なし学される変数選択法べき(だが、本研究ではタッまった教師なし学習にく注目されて平均いなくて平均、本研究ではタッこの前立腺がんマル論文も1も1

    年以上前の前立腺がんマル論文も1ですがまった教師なし学習にく誰にも引用されてにも引用いた教師なし学されて平均いませんマルチオミック ) 😅)