Upgrade to Pro — share decks privately, control downloads, hide ads and more …

MATHEMATICAL FORMULATION AND APPLICATION OF KERNEL TENSOR DECOMPOSITION BASED UNSUPERVISED FEATURE EXTRACTION

Y-h. Taguchi
September 28, 2021

MATHEMATICAL FORMULATION AND APPLICATION OF KERNEL TENSOR DECOMPOSITION BASED UNSUPERVISED FEATURE EXTRACTION

Presentation at IIBMP2021
https://iibmp2021.hamadalab.com/

Y-h. Taguchi

September 28, 2021
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. Y-H. Taguchi and Turki Turki
    Mathematical formulation and application of kernel tensor
    decomposition based unsupervised feature extraction
    Knowledge-Based Systems (IF=8.0)
    Volume 217, 6 April 2021, 106834
    https://doi.org/10.1016/j.knosys.2021.106834

    View full-size slide

  2. Tucker分解
    直交行列

    View full-size slide

  3. 線形計算なのでうまく行なのでうまく行くときはよい行く行くときはよいときはよいが、うまく行くときはよい行かないと工夫
    の余地がない→カーネがない→カーネルトリッカーネルトリックが使えないか?が使えないか?えないか?
    線形カーネル
    これでうまく行くときはよい定式化できれば、ここできれば、ここを非線形カー非線形カー
    ネルに置き換えれば計置き換えれば計算き換えれば計算可能えれば計算なのでうまく行可能

    View full-size slide

  4. つまり   を非線形カーテンソル分解すれば元の計算すれば元の計算と一致すの計算なのでうまく行と一致するする
    を非線形カーテンソル分解すれば元の計算すればカーネルテンソル分解すれば元の計算

    View full-size slide

  5. 複数の線形カーネルの線形カーネルの統合解すれば元の計算析
    特異値分解すれば元の計算

    View full-size slide

  6. 複数の線形カーネルの非線形カーネルの統合解すれば元の計算析
    特異値分解すれば元の計算

    View full-size slide

  7. スイスロール
    k=1〜10

    View full-size slide

  8. 単体のスイスロールのスイスロール 単体のスイスロールのスイスロールの特異値分解すれば元の計算
    スイスロール10個のタッカー分解のタッカー分解すれば元の計算
    スイスロール1
    0個のタッカー分解のカーネル
    テンソル分解すれば元の計算

    View full-size slide

  9. 11
    N variables
    N
    1
    M measurements
    M/2
    M measurements
    Gaussian
    Zero mean
    Gaussian
    Non-zero mean
    M2 samples
    /variable
    i≦N
    1
    :distinct between j,k≦M/2 and others
    i>N
    1
    : no distinction
    Task: Can we identify N
    1
    variables correctly?
    人工データ

    View full-size slide

  10. 使えないか?用したカーネルしたカーネルカーネル

    View full-size slide

  11. 性能比較
    カーネルテンソル分解すれば元の計算
    二群ののt検定、M個のタッカー分解のP値を非線形カー多重比較補正
    比較手法
    N行M2列の行列に置き換えれば計展開してして
    カーネル主成分分析
    二群ののt検定、M2個のタッカー分解のP値を非線形カー多重比較補正

    View full-size slide

  12. 補正前と補正後のと補正後ののP値の幾何平均

    View full-size slide

  13. 実データ(データ(SARS-CoV-2, IIBMP2020,ハイライト)
    x
    i jk m
    ∈ℝ21797×5×2×3
    データセット GSE147507
    3種類の肺がんの培養の肺がんの培養細肺がんの培養細胞がんの肺がんの培養細培養細胞ににSARS-CoV-2を感染させた。感染させた。させた。
    i:遺伝子(21797)
    j: j=1:Calu3, j=2: NHBE, j=3:A549 MOI:0.2, j=4:
    A549 MOI 2.0, j=5:A549 ACE2 expressed
    (MOI:Multiplicity of infection)
    k: k=1: Mock, k=2:SARS-CoV-2 infected
    m: three biological replicates

    View full-size slide

  14. 16
    Feature selection
    Feature selection
    Linear Kernel:
    x
    jkj’k’
    → u
    l1j
    , u
    l2k
    u
    l
    1 i
    ∝∑
    jk
    x
    ijk
    u
    l
    1
    j
    u
    l
    2
    k
    P
    i
    =P
    χ2
    [>
    (u
    l
    1
    i
    σl
    1
    )2]
    Computed P-values are corrected with considering multiple
    comparison corrections by Benjamini-Hochberg method.
    Features with corrected P-values <0.01 are selected.
    TD

    View full-size slide

  15. 17
    RBF, Polynomial Kernels
    Exclusion of a specific i
    i
    Recompute x
    jkj’k’
    x
    jkj’k’
    → u
    l1j
    ⨉ u
    l2k
    TD
    Estimate coincidence between u
    l1j
    , u
    l2k
    and classification of (k,j)
    Rank i
    i based upon the amount of decreased coincidence
    u
    l1j
    ⨉ u
    l2k
    k

    View full-size slide

  16. 18
    Application to SARS-CoV-2 data set
    Applying RBF kernel and select 163 top ranked genes.

    View full-size slide

  17. 19
    カーネルテンソル分解すれば元の計算を非線形カー用したカーネルいたカーネル変数の線形カーネル選択法を非線形カー提案した。したカーネル。
    スイスロールの構造をある程度、検を非線形カーある程度、検出できたできたカーネル
    人工データでは線形カーネルを非線形カー越えられなかったえられなかったカーネル
    SARS-CoV-2ではRBFカーネルで線形の場合を非線形カー大きく改善きく行くときはよい改善
    する結果が得られた。が得られた。られたカーネル。

    View full-size slide