Slide 1

Slide 1 text

Y-H. Taguchi and Turki Turki Mathematical formulation and application of kernel tensor decomposition based unsupervised feature extraction Knowledge-Based Systems (IF=8.0) Volume 217, 6 April 2021, 106834 https://doi.org/10.1016/j.knosys.2021.106834

Slide 2

Slide 2 text

Tucker分解 直交行列

Slide 3

Slide 3 text

線形計算なのでうまく行なのでうまく行くときはよい行く行くときはよいときはよいが、うまく行くときはよい行かないと工夫 の余地がない→カーネがない→カーネルトリッカーネルトリックが使えないか?が使えないか?えないか? 線形カーネル これでうまく行くときはよい定式化できれば、ここできれば、ここを非線形カー非線形カー ネルに置き換えれば計置き換えれば計算き換えれば計算可能えれば計算なのでうまく行可能

Slide 4

Slide 4 text

No content

Slide 5

Slide 5 text

No content

Slide 6

Slide 6 text

つまり   を非線形カーテンソル分解すれば元の計算すれば元の計算と一致すの計算なのでうまく行と一致するする を非線形カーテンソル分解すれば元の計算すればカーネルテンソル分解すれば元の計算

Slide 7

Slide 7 text

複数の線形カーネルの線形カーネルの統合解すれば元の計算析 特異値分解すれば元の計算

Slide 8

Slide 8 text

複数の線形カーネルの非線形カーネルの統合解すれば元の計算析 特異値分解すれば元の計算

Slide 9

Slide 9 text

スイスロール k=1〜10

Slide 10

Slide 10 text

単体のスイスロールのスイスロール 単体のスイスロールのスイスロールの特異値分解すれば元の計算 スイスロール10個のタッカー分解のタッカー分解すれば元の計算 スイスロール1 0個のタッカー分解のカーネル テンソル分解すれば元の計算

Slide 11

Slide 11 text

11 N variables N 1 M measurements M/2 M measurements Gaussian Zero mean Gaussian Non-zero mean M2 samples /variable i≦N 1 :distinct between j,k≦M/2 and others i>N 1 : no distinction Task: Can we identify N 1 variables correctly? 人工データ

Slide 12

Slide 12 text

使えないか?用したカーネルしたカーネルカーネル

Slide 13

Slide 13 text

性能比較 カーネルテンソル分解すれば元の計算 二群ののt検定、M個のタッカー分解のP値を非線形カー多重比較補正 比較手法 N行M2列の行列に置き換えれば計展開してして カーネル主成分分析 二群ののt検定、M2個のタッカー分解のP値を非線形カー多重比較補正

Slide 14

Slide 14 text

補正前と補正後のと補正後ののP値の幾何平均

Slide 15

Slide 15 text

実データ(データ(SARS-CoV-2, IIBMP2020,ハイライト) x i jk m ∈ℝ21797×5×2×3 データセット GSE147507 3種類の肺がんの培養の肺がんの培養細肺がんの培養細胞がんの肺がんの培養細培養細胞ににSARS-CoV-2を感染させた。感染させた。させた。 i:遺伝子(21797) j: j=1:Calu3, j=2: NHBE, j=3:A549 MOI:0.2, j=4: A549 MOI 2.0, j=5:A549 ACE2 expressed (MOI:Multiplicity of infection) k: k=1: Mock, k=2:SARS-CoV-2 infected m: three biological replicates

Slide 16

Slide 16 text

16 Feature selection Feature selection Linear Kernel: x jkj’k’ → u l1j , u l2k u l 1 i ∝∑ jk x ijk u l 1 j u l 2 k P i =P χ2 [> (u l 1 i σl 1 )2] Computed P-values are corrected with considering multiple comparison corrections by Benjamini-Hochberg method. Features with corrected P-values <0.01 are selected. TD

Slide 17

Slide 17 text

17 RBF, Polynomial Kernels Exclusion of a specific i i Recompute x jkj’k’ x jkj’k’ → u l1j ⨉ u l2k TD Estimate coincidence between u l1j , u l2k and classification of (k,j) Rank i i based upon the amount of decreased coincidence u l1j ⨉ u l2k k

Slide 18

Slide 18 text

18 Application to SARS-CoV-2 data set Applying RBF kernel and select 163 top ranked genes.

Slide 19

Slide 19 text

19 カーネルテンソル分解すれば元の計算を非線形カー用したカーネルいたカーネル変数の線形カーネル選択法を非線形カー提案した。したカーネル。 スイスロールの構造をある程度、検を非線形カーある程度、検出できたできたカーネル 人工データでは線形カーネルを非線形カー越えられなかったえられなかったカーネル SARS-CoV-2ではRBFカーネルで線形の場合を非線形カー大きく改善きく行くときはよい改善 する結果が得られた。が得られた。られたカーネル。