Upgrade to Pro — share decks privately, control downloads, hide ads and more …

MATHEMATICAL FORMULATION AND APPLICATION OF KERNEL TENSOR DECOMPOSITION BASED UNSUPERVISED FEATURE EXTRACTION

948966d9c690e72faba4fd76e1858c56?s=47 Y-h. Taguchi
September 28, 2021

MATHEMATICAL FORMULATION AND APPLICATION OF KERNEL TENSOR DECOMPOSITION BASED UNSUPERVISED FEATURE EXTRACTION

Presentation at IIBMP2021
https://iibmp2021.hamadalab.com/

948966d9c690e72faba4fd76e1858c56?s=128

Y-h. Taguchi

September 28, 2021
Tweet

Transcript

  1. Y-H. Taguchi and Turki Turki Mathematical formulation and application of

    kernel tensor decomposition based unsupervised feature extraction Knowledge-Based Systems (IF=8.0) Volume 217, 6 April 2021, 106834 https://doi.org/10.1016/j.knosys.2021.106834
  2. Tucker分解 直交行列

  3. 線形計算なのでうまく行なのでうまく行くときはよい行く行くときはよいときはよいが、うまく行くときはよい行かないと工夫 の余地がない→カーネがない→カーネルトリッカーネルトリックが使えないか?が使えないか?えないか? 線形カーネル これでうまく行くときはよい定式化できれば、ここできれば、ここを非線形カー非線形カー ネルに置き換えれば計置き換えれば計算き換えれば計算可能えれば計算なのでうまく行可能

  4. None
  5. None
  6. つまり   を非線形カーテンソル分解すれば元の計算すれば元の計算と一致すの計算なのでうまく行と一致するする を非線形カーテンソル分解すれば元の計算すればカーネルテンソル分解すれば元の計算

  7. 複数の線形カーネルの線形カーネルの統合解すれば元の計算析 特異値分解すれば元の計算

  8. 複数の線形カーネルの非線形カーネルの統合解すれば元の計算析 特異値分解すれば元の計算

  9. スイスロール k=1〜10

  10. 単体のスイスロールのスイスロール 単体のスイスロールのスイスロールの特異値分解すれば元の計算 スイスロール10個のタッカー分解のタッカー分解すれば元の計算 スイスロール1 0個のタッカー分解のカーネル テンソル分解すれば元の計算

  11. 11 N variables N 1 M measurements M/2 M measurements

    Gaussian Zero mean Gaussian Non-zero mean M2 samples /variable i≦N 1 :distinct between j,k≦M/2 and others i>N 1 : no distinction Task: Can we identify N 1 variables correctly? 人工データ
  12. 使えないか?用したカーネルしたカーネルカーネル

  13. 性能比較 カーネルテンソル分解すれば元の計算 二群ののt検定、M個のタッカー分解のP値を非線形カー多重比較補正 比較手法 N行M2列の行列に置き換えれば計展開してして カーネル主成分分析 二群ののt検定、M2個のタッカー分解のP値を非線形カー多重比較補正

  14. 補正前と補正後のと補正後ののP値の幾何平均

  15. 実データ(データ(SARS-CoV-2, IIBMP2020,ハイライト) x i jk m ∈ℝ21797×5×2×3 データセット GSE147507 3種類の肺がんの培養の肺がんの培養細肺がんの培養細胞がんの肺がんの培養細培養細胞ににSARS-CoV-2を感染させた。感染させた。させた。 i:遺伝子(21797)

    j: j=1:Calu3, j=2: NHBE, j=3:A549 MOI:0.2, j=4: A549 MOI 2.0, j=5:A549 ACE2 expressed (MOI:Multiplicity of infection) k: k=1: Mock, k=2:SARS-CoV-2 infected m: three biological replicates
  16. 16 Feature selection Feature selection Linear Kernel: x jkj’k’ →

    u l1j , u l2k u l 1 i ∝∑ jk x ijk u l 1 j u l 2 k P i =P χ2 [> (u l 1 i σl 1 )2] Computed P-values are corrected with considering multiple comparison corrections by Benjamini-Hochberg method. Features with corrected P-values <0.01 are selected. TD
  17. 17 RBF, Polynomial Kernels Exclusion of a specific i i

    Recompute x jkj’k’ x jkj’k’ → u l1j ⨉ u l2k TD Estimate coincidence between u l1j , u l2k and classification of (k,j) Rank i i based upon the amount of decreased coincidence u l1j ⨉ u l2k k
  18. 18 Application to SARS-CoV-2 data set Applying RBF kernel and

    select 163 top ranked genes.
  19. 19 カーネルテンソル分解すれば元の計算を非線形カー用したカーネルいたカーネル変数の線形カーネル選択法を非線形カー提案した。したカーネル。 スイスロールの構造をある程度、検を非線形カーある程度、検出できたできたカーネル 人工データでは線形カーネルを非線形カー越えられなかったえられなかったカーネル SARS-CoV-2ではRBFカーネルで線形の場合を非線形カー大きく改善きく行くときはよい改善 する結果が得られた。が得られた。られたカーネル。