テンソル分解を用いた教師無し学習による変数選択法の一細胞 RNA-seq解析への応用

1 テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法変数選択法の一細胞一細胞 RNA-seq解を用いた教師無析への応用への一細胞応用いた教師無し学中央大学物理学科田口善弘こちらの一細胞 QRコードでダウンロードでダウンロード可ダウンロードでダウンロード可能→

2 宣伝：今日の講演内容につの一細胞講演内容につながる最近につながる変数選択法最近の自分の研究をの一細胞自分の一細胞研究をまとめてを用いた教師無しまとめて２０１９年９月に年９年９月に月ににSpringer社から単著で出しから単著で出しました。でダウンロード可出しました。し学習による変数まし学習による変数た教師無し学習に。読んで頂けると光んでダウンロード可頂けると光栄ですける変数選択法と光栄です。でダウンロード可す。 Y-h. Taguchi
Unsupervised Feature Extraction Applied to Bioinformatics: A PCA Based and TD Based Approach Springer International

3 主成分分析への応用vs正準相関分析への応用行列x ij ∈ ℝN⨉Mとx ik ∈ ℝN⨉Kがある変数選択法。主成分分析への応用
主成分分析への応用 (x ij ,x ik )∈ ℝN⨉(M+K) をN次元ベクトル（ベクトル（M+K）本だとみなして本だとみなして低だとみなして低次元低次元ベクトル（に射影（主成分分射影（主成分分析は本来、２つのは本来、２つの行本だとみなして低来、２つの行列の統合つの行列の統合解析行列の統合解析を目の行列の統合解析統合解析は本来、２つのを目的としたとした手法ではない）。では本来、２つの行ない）本だとみなして。正準相関分析は本来、２つの正準相関分析は本来、２つの正準変量y li ,y’ li を用いた教師無し作るる変数選択法(1≦l≦min(M,K))。 y li とy’ li の一細胞相関係数（正準相関係数）が最大になるよが最大になる変数選択法ように uc lj ,uc lk （正準変量係数）が最大になるよを用いた教師無し決める。める変数選択法。（正準変量係数）が最大になるよを用いた教師無し決める。める変数選択法。 y li =∑j u lj c x ij y ' li =∑k u lk c x ik

4 正準相関分析への応用は主成分分析より主成分分析への応用より優れている？優れている？れている変数選択法？赤穂昭太郎, 正準相関分析への応用入門日の講演内容につ本神経回路学会誌 Vol. 20, No. 2(2013),62–72 「主成分分析への応用
主成分分析への応用でダウンロード可は主成分分析より『観測信号観測信号=信号（u(t)）が最大になるよ+ノイズ（s 1 (t) , s 2 (t)）が最大になるよ』と考ええ, 信号を用いた教師無し取り出すときにり優れている？出しました。すときに, 「信号=パワーの一細胞大きい成分,ノイズ= パワーの一細胞小さい成分」といさい成分」という仮説のもとの一細胞もと,パワーの一細胞大きい成分を用いた教師無し取り出すときにり優れている？出しました。す.た教師無し学習にだし学習による変数,それを用いた教師無し上のデータに適用の一細胞データに適用してしまに適用いた教師無し学し学習による変数てし学習による変数まうと, s 1 (t) や s 2 (t) が抽出しました。され,埋もれているもれている変数選択法 u(t) の一細胞成分は主成分分析より抽出しました。されない. 一方,正準相関分析への応用正準相関分析への応用でダウンロード可は主成分分析より『観測信号観測信号=独自信号+共通信号+ノイズ』の一細胞ように考ええ,独自信号を用いた教師無し除いて共通信号だいて共通信号だけを用いた教師無し抽出しました。し学習による変数ようとする変数選択法た教師無し学習にめ,うまく u(t) が抽出しました。された教師無し学習にというわけでダウンロード可ある変数選択法.」正準相関分析への応用　＞　主成分分析への応用？

5 x(t)=±s 1 (t)+εu(t) (ε≪1) y(t)=±s 2 (t)+εu(t) (ε≪1) 主成分分析への応用　主成分
正準相関分析への応用　正準変量

6 本当？第一主成分第二主成分第三主成分 ε=0.1 うそは主成分分析よりいけない....。

7 し学習による変数かし学習による変数、主成分分析の第主成分分析への応用の一細胞第三主成分の一細胞寄与率はは主成分分析より１％以下。そんなところまでダウンロード可みないといけないの一細胞は主成分分析よりいかがなもの一細胞か？＆正準相関分析への応用って本当に有効なの？なの一細胞？
↓ テンソル分解を用いた教分解を用いた教師無の一細胞方がいいの一細胞でダウンロード可は主成分分析より？

8 テンソル分解を用いた教分解を用いた教師無でダウンロード可正準相関分析への応用っぽいことを用いた教師無しする変数選択法には主成分分析より？ x ij ∈ℝN ×M ,x ik ∈ℝN×K x
ijk ≡x ij ⋅x ik ∈ℝN ×M×K x ijk =∑ l 1 ,l 2, l 3 G(l 1 ,l 2 ,l 3 )u l 1 i u l 2 j u l 3 k G(l 1 ,l 2 ,l 3 )∈ℝN×M×K u l 1 i ∈ℝN ×N ,u l 2 j ∈ℝM ×M ,u l 3 k ∈ℝK× K

9 赤穂先生のデータに適用の一細胞データに適用してしまに適用いた教師無し学(テンソル分解を用いた教分解を用いた教師無は主成分分析より最低値が非負にが非負にに最低値が非負にが非負にになる変数選択法ように底上のデータに適用げ後後なる変数選択法ように底上のデータに適用げ後後、主成分分析の第HOSVDを用いた教師無し採用いた教師無し学）が最大になるよ。 Gの一細胞絶対値が非負に最大＝G(1,1,1) u 1i
u 1j =u 1k 同じシグナルが含じシグナルが含まシグナル分解を用いた教が含まれているのでまれている変数選択法の一細胞でダウンロード可「和」になるので同」になる変数選択法の一細胞でダウンロード可同じシグナルが含じシグナルが含ま値が非負に正準相関解を用いた教師無析への応用の一細胞正準変量係数に相当

10 なんでダウンロード可「成分の一細胞積を取ってからテを用いた教師無し取り出すときにってからテンソル分解を用いた教分解を用いた教師無する変数選択法と信号が第一主成分になる変数選択法の一細胞か？」多分、主成分分析の第でダウンロード可すが.....。「異なったノイズ（なった教師無し学習にノイズ（平均ゼロ）の積（ゼロ）が最大になるよの一細胞積を取ってからテ（s 1 (t)×s
2 (t)）が最大になるよの一細胞平均ゼロ）の積（」＝ゼロゼロ「信号（平均ゼロ）の積（ゼロ）が最大になるよの一細胞積を取ってからテ（u(t)2）が最大になるよの一細胞平均ゼロ）の積（」≠ゼロゼロテンソル分解を用いた教分解を用いた教師無（行列の一細胞場合の特異値分解にの一細胞特異なったノイズ（値が非負に分解を用いた教師無に相当）が最大になるよは主成分分析より（平均ゼロ）の積（からの一細胞変位を扱う）相関係を用いた教師無し扱う）相関係数をう）が最大になるよ相関係数を用いた教師無し計算しているわけでし学習による変数ている変数選択法わけでダウンロード可は主成分分析よりなく、主成分分析の第「値が非負にの一細胞二乗」で重みが決ま」でダウンロード可重みが決まるのでみが決める。まる変数選択法の一細胞でダウンロード可、主成分分析の第「二乗」で重みが決まの一細胞平均ゼロ）の積（がゼロかどうか」は主成分分析より本質的な差になる。な差になる。になる変数選択法。

11 正準相関が駄目な例（同じく、な例（同じシグナルが含じシグナルが含まく、主成分分析の第赤穂先生のデータに適用の一細胞文献）が最大になるよ信号１信号２相関係数がゼロなの一細胞でダウンロード可正準相関分析への応用は主成分分析より失敗！

12 「カーネル分解を用いた教正準相関分析への応用使えば『うまく』えば『観測信号うまく』行きます」by赤穂先生のデータに適用でダウンロード可も、主成分分析の第テンソル分解を用いた教でダウンロード可やれば「相関」は主成分分析より見える（線形演算える変数選択法（線形演算しているわけでなの一細胞に！）が最大になるよ信号１と２の一細胞平均ゼロ）の積（に相当

13 なんでダウンロード可「成分の一細胞積を取ってからテを用いた教師無し取り出すときにってからテンソル分解を用いた教分解を用いた教師無する変数選択法と『観測信号相関』が見える（線形演算える変数選択法の一細胞か？」多分、主成分分析の第でダウンロード可すが.....。非負に化する時に定数をする変数選択法時に定数を加えるに定数を用いた教師無し加えるので「える変数選択法の一細胞でダウンロード可「定数＋定数＋信号」になる変数選択法。掛け算するのでけ算しているわけでする変数選択法の一細胞
でダウンロード可（定数＋信号１）が最大になるよ×（定数＋信号２）が最大になるよ＝ゼロ定数２＋定数×信号１＋定数×信号２＋信号１×信号２ここから「相関」が出しました。てきている変数選択法

14 正準相関分析への応用正準相関分析への応用 →正準相関変量の一細胞相関が最大になる変数選択法ように正準変量係数を用いた教師無し最適化する時に定数をする変数選択法「教師あり優れている？学習による変数選択」テンソル分解を用いた教分解を用いた教師無テンソル分解を用いた教分解を用いた教師無 →行列の一細胞積を取ってからテでダウンロード可作るった教師無し学習にテンソル分解を用いた教を用いた教師無しテンソル分解を用いた教分解を用いた教師無する変数選択法だけでダウンロード可「信号」
が取り出すときにり優れている？出しました。せる変数選択法「教師なし学習による変数学習による変数選択」同じシグナルが含じシグナルが含ま性能なら、主成分分析の第仮定を用いた教師無しおかない教師なし学習による変数学習による変数選択の一細胞方がロバストででダウンロード可優れている？れている変数選択法だろう。

15 現実のデータの解析の一細胞データに適用してしまの一細胞解を用いた教師無析への応用個々の細胞（〜数千の一細胞細胞（〜数千個）が最大になるよの一細胞遺伝子（〜数万個）が最大になるよの一細胞発現量（実のデータの解析数値が非負に>0）が最大になるよを用いた教師無し胎児のの一細胞中脳領域で複数の発生段でダウンロード可複数の一細胞
発生のデータに適用段階（→時に定数を加える刻）が最大になるよでダウンロード可ヒトでとマウスでダウンロード可計測し学習による変数た教師無し学習にデータに適用してしまがある変数選択法。変数：遺伝子の一細胞発現量（実のデータの解析数値が非負に>0）が最大になるよサンプル分解を用いた教：個々の細胞（〜数千の一細胞細胞ラベル分解を用いた教：計測時に定数を加える刻

16 ヒトで x ij ∈ℝ19531×1977 x ik ∈ℝ24378×1907 マウスデータに適用してしまセットで　GSE76381
一細胞RNA-seq ヒトでとマウスの一細胞中脳の一細胞発生のデータに適用過程 i:遺伝子 j,k:細胞数観測の一細胞タに適用してしまイムポイントでと各々の細胞（〜数千の一細胞細胞数は主成分分析よりヒトでが、主成分分析の第6週目な例（同じく、：287細胞、主成分分析の第7週目な例（同じく、：131細胞、主成分分析の第8週目な例（同じく、：331細胞、主成分分析の第9週目な例（同じく、： 322細胞、主成分分析の第10週目な例（同じく、：509細胞、主成分分析の第11週目な例（同じく、：397細胞、主成分分析の第の一細胞計1977細胞、主成分分析の第マウスが、主成分分析の第E11.5：349細胞、主成分分析の第E12.5：350細胞、主成分分析の第E13.5：345細胞、主成分分析の第E14.5： 308細胞、主成分分析の第E15.5：356細胞、主成分分析の第E18.5：142細胞、主成分分析の第不明：57細胞、主成分分析の第の一細胞計1907 細胞。

17 目な例（同じく、的な差になる。ヒトでとマウスは主成分分析より発生のデータに適用過程が違うので時間のうの一細胞でダウンロード可時に定数を加える間のの一細胞一対一対応は主成分分析よりない。し学習による変数かし学習による変数、主成分分析の第「ヒトでとマウスでダウンロード可共通に時に定数を加える間の依存性がある変数選択法」遺伝子を用いた教師無し知り優れている？た教師無し学習にい、主成分分析の第というニーズがある変数選択法。（どの一細胞ような時に定数を加える間の依存性か、主成分分析の第は主成分分析より問わない）わない）が最大になるよ

18 正準相関分析への応用正準相関分析への応用共通遺伝子に限定し学習による変数た教師無し学習にx ij ∈ ℝ13384×1977 とx ik ∈
ℝ13384×1907 に正準相関分析への応用を用いた教師無し適用いた教師無し学。正準変量y li (遺伝子iに付与,1≦l≦1907) ヒトで： , マウス： uc lj ,uc lk は主成分分析より正準変量係数正準変量係数。 uc lj ,uc lk の一細胞うち、主成分分析の第時に定数を加える間の依存性がある変数選択法もの一細胞を用いた教師無し探す。す。 y li =∑j u lj c x ij y ' li =∑k u lk c x ik

19 方法：カテゴリカル分解を用いた教回帰（ANOVAと等価）が最大になるよ u lj c =a l +∑t δtj b
lt u lk c =a' l +∑t δtk b' lt a l ,a l ’,b l ,b l ’ :回帰係数、主成分分析の第δ tj ,δ tk : j,k番目の行列の統合解析細胞が時刻が時刻時刻tに射影（主成分分計測されてされて低次元いれば１、そうでなければ０（一種のデルタ関数）の行列の統合解析デルタ関数）。関数）本だとみなして。 Rの行列の統合解析lm関数でP値を計算。を計算。Benjamini Hochberg基準で多重比較補正。補正P値を計算。が時刻0.01以下のものを「有意の行列の統合解析もの行列の統合解析を「有意に時間依存有意に時間依存」とに射影（主成分分時間依存」と判定」と判定

20 結果： t依存性の一細胞ある変数選択法正準変量係数uc lj は主成分分析より皆無し学習による変皆無し学習による変だった教師無し学習に。 → 今回の一細胞場合の特異値分解に、主成分分析の第正準変量y
li (遺伝子iに付与)は主成分分析よりヒトで：マウス：でダウンロード可計算しているわけででダウンロード可きる変数選択法が、主成分分析の第マウスとヒトででダウンロード可共通の一細胞遺伝子発現プロファイル分解を用いた教に相当する変数選択法正準変量y li が得られても、時間られても、主成分分析の第時に定数を加える間の依存性がないた教師無し学習にめ、主成分分析の第「どの一細胞ような生のデータに適用物学的な差になる。な意味がある遺伝子発がある変数選択法遺伝子発現プロファイル分解を用いた教なの一細胞か？」という問わない）に答えられないのでえられないの一細胞でダウンロード可「生のデータに適用物学の一細胞解を用いた教師無析への応用」とし学習による変数ては主成分分析より価値が非負にが薄くなってしまうくなってし学習による変数まう。し学習による変数かし学習による変数、主成分分析の第「正準変量係数に時に定数を加える間の依存性がある変数選択法という条件付きでダウンロード可正準相関係数を用いた教師無し最大化する時に定数を」は主成分分析より簡単でダウンロード可は主成分分析よりない（Benjamini Hochberg基準で多重比較補正したP値を計算。が時刻0.01以下のものを「有意、という条件を式で書くを式で書くで書くくの行列の統合解析は本来、２つの行難しいしい）が最大になるよ。 y li =∑j u lj c x ij y li '=∑k u lk c x ik

21 テンソル分解を用いた教分解を用いた教師無を用いた教師無し使えば『うまく』うテンソル分解を用いた教分解を用いた教師無を用いた教師無し使えば『うまく』う行列の一細胞要素をを用いた教師無し掛け算するのでけてテンソル分解を用いた教を用いた教師無し作るる変数選択法。 x ijk = x ij
× x ik ∈ ℝ13384×1977×1907 サイズが大きすぎてテンソル分解を用いた教分解を用いた教師無でダウンロード可きないの一細胞でダウンロード可縮約 x jk :を用いた教師無し特異なったノイズ（値が非負に分解を用いた教師無し学習による変数て u lj :第lヒトで細胞特異なったノイズ（値が非負にベクトでル分解を用いた教(正準変量係数に相当) u lk :第lマウス細胞特異なったノイズ（値が非負にベクトでル分解を用いた教(正準変量係数に相当) を用いた教師無し得られても、時間る変数選択法。 i:遺伝子 j,k:細胞数 x jk =∑ i x ijk x jk =∑ l u lj λl u lk

22 何らかの時間依存らかの一細胞時に定数を加える間の依存性がある変数選択法 u lj と u lk を用いた教師無しカテゴリ回帰（ANOVA）が最大になるよでダウンロード可選択。 u
lj =a l +∑ t b lt δjt u lk =a l '+∑ t b lt ' δkt δ jt ,δ kt ：細胞j,kが時に定数を加える刻tなら１,そうじシグナルが含まゃなければ０選択された教師無し学習に特異なったノイズ（値が非負にベクトでル分解を用いた教の一細胞共通度 12 23 32 32 ヒトでマウス

23 u li ( j)=∑ j u lj x ij
u li (k)=∑ k u lk x ik 第lヒトで遺伝子特異なったノイズ（値が非負にベクトでル分解を用いた教第lマウス遺伝子特異なったノイズ（値が非負にベクトでル分解を用いた教 u lj と u lk から u li （正準変量に相当）が最大になるよを用いた教師無し作るる変数選択法（＊）が最大になるよ x ij =∑ l u li λl u lj x ik =∑ l u li ' λl ' u lk 意味がある遺伝子発：x ij とx ik を用いた教師無し個別に特異値分解すに特異なったノイズ（値が非負に分解を用いた教師無する変数選択法ともし学習による変数、主成分分析の第u li =u’ li なら ∑ i x ij x ik =∑ i ∑ l u li λl u lj ∑ l' u l' i λ' l' u l' k =∑ l ∑ l' λl u lj λ' l' u l' k ∑ i u li u l' i =∑ l ∑ l' λl u lj λ' l' u l' k δll' =∑ l λl λl ' u lj u lk なの一細胞でダウンロード可、主成分分析の第（＊）が最大になるよは主成分分析より定数倍を除いて正しいを用いた教師無し除いて共通信号だいて正し学習による変数いが、主成分分析の第一般的な差になる。には主成分分析より正し学習による変数くない

24 u(j) li とu(k) li にχ2分布を仮定を用いた教師無し仮定(帰無し学習による変仮説のもと)し学習による変数て遺伝子にP値が非負にを用いた教師無し付与、主成分分析の第BH基準でダウンロード可多重みが決まるので比較補正し学習による変数て0.01以下の一細胞遺伝子を用いた教師無し選択 P i
=P χ2 [ >∑ l∈Ωl ( u li σl ) 2 ] u(j) li とu(k) li が似ていれば、（＊ていれば、主成分分析の第（＊）が最大になるよは主成分分析より意味がある遺伝子発がある変数選択法。生のデータに適用物だとヒトでとマウスでダウンロード可遺伝子が共通かどうかが問わない）題なのでなの一細胞でダウンロード可u(j) li とu(k) li を用いた教師無し使えば『うまく』って「時に定数を加える間の依存性がある変数選択法遺伝子」を用いた教師無し選んでダウンロード可どれくらい一致したかを見るし学習による変数た教師無し学習にかを用いた教師無し見える（線形演算る変数選択法 →u(j) li やu(k) li の一細胞絶対値が非負にが大きいiを用いた教師無し選ぶ。（時に定数を加える間の依存性の一細胞ある変数選択法u lj と u lk への一細胞射影が大きい遺伝子が大きい遺伝子）が最大になるよ

25 151 200 305 305 ヒトでマウス選択遺伝子１３３８４個の一細胞遺伝子からの一細胞
選択でダウンロード可ある変数選択法ことを用いた教師無し考え慮するとよく一致する変数選択法とよく一致したかを見るし学習による変数ていた教師無し学習に結論：正準相関分析への応用でダウンロード可は主成分分析より「時に定数を加える間の依存性（正準変量係数に時に定数を加える間の依存性がある変数選択法）が最大になるよがあり優れている？、主成分分析の第かつ、主成分分析の第共通（正準変量間のに有意の一細胞相関がある変数選択法）が最大になるよの一細胞遺伝子発現プロファイル分解を用いた教を用いた教師無し持ってほしい」みってほし学習による変数い」みた教師無し学習にいな二重みが決まるのでの一細胞要求を満たすことはを用いた教師無し満たすことは難した教師無し学習にすことは主成分分析より難しかったが、こし学習による変数かった教師無し学習にが、主成分分析の第こういうこと（僕はこれはは主成分分析よりこれは主成分分析よりテンソル分解を用いた教分解を用いた教師無の一細胞近の自分の研究を似ていれば、（＊だと思っていますが）っていますが）が最大になるよを用いた教師無しする変数選択法と計算しているわけででダウンロード可きる変数選択法。

26 おまけ u li ( j)=∑ j u lj x
ij u li (k)=∑ k u lk x ik 第lヒトで遺伝子特異なったノイズ（値が非負にベクトでル分解を用いた教第lマウス遺伝子特異なったノイズ（値が非負にベクトでル分解を用いた教 u lj と u lk から u li を用いた教師無し作るる変数選択法（＊）が最大になるよみた教師無し学習にいなことは主成分分析よりどれくらい「正し学習による変数い」の一細胞か？ [既知] Xがx ij の一細胞行列、主成分分析の第X’がx ik の一細胞行列だとする変数選択法と、主成分分析の第直交行列Q ∈ ℝN⨉N と上のデータに適用三角行列R ∈ ℝN⨉N を用いた教師無し使えば『うまく』って X = QRTΣVVT X’ =QR-1ΣV’V’T と書ける。但し、ける変数選択法。但し、し学習による変数、主成分分析の第ΣV,ΣV’は主成分分析より対角行列、主成分分析の第V ∈ ℝM⨉N ,V’ ∈ ℝK⨉Nは主成分分析より VTV=V’TV’=Iを用いた教師無し満たすことは難した教師無し学習にす。

27 XTX’= VΣVΣV’ V’T と書ける。但し、ける変数選択法の一細胞でダウンロード可、主成分分析の第V,V’は主成分分析よりXTX’の一細胞特異なったノイズ（値が非負に分解を用いた教師無になっている変数選択法。 XV = QRTΣV
X’ V’=QR-1ΣV’ なの一細胞でダウンロード可、主成分分析の第（＊）が最大になるよは主成分分析よりRが対角行列なら同じシグナルが含じシグナルが含まu li を用いた教師無しあた教師無し学習にえる変数選択法。（＊）が最大になるよは主成分分析より「R の一細胞非対角成分を用いた教師無し無し学習による変視」した近似。」し学習による変数た教師無し学習に近の自分の研究を似ていれば、（＊。

28 疑問わない） XTX’の一細胞特異なったノイズ（値が非負に分解を用いた教師無と正準相関分析への応用は主成分分析よりそんなに違うので時間のうことを用いた教師無しし学習による変数ている変数選択法わけでダウンロード可は主成分分析よりない（XTX’の一細胞特異なったノイズ（値が非負に分解を用いた教師無は主成分分析よりV,VT（正準変量係数に相当）が最大になるよの一細胞直交性を用いた教師無し要請している一方、し学習による変数ている変数選択法一方、主成分分析の第正準相関分析への応用は主成分分析よりXV,XVT（正準変量に相当）が最大になるよの一細胞直交性を用いた教師無し要請している一方、する変数選択法
と共にX,X’が列規格化する時に定数を（列ベクトでル分解を用いた教が平均ゼロ）の積（０、主成分分析の第分散１に規格化する時に定数をされている変数選択法）が最大になるよされている変数選択法だけでダウンロード可ほぼ同じ）。同じシグナルが含じシグナルが含ま）が最大になるよ。なぜ、主成分分析の第ここまでダウンロード可結果が違うので時間のうの一細胞か？（正準相関分析への応用でダウンロード可求を満たすことはまった教師無し学習に正準変量係数には主成分分析より時に定数を加える間の依存性がまった教師無し学習にくなかった教師無し学習にが、主成分分析の第 XTX’の一細胞特異なったノイズ（値が非負に分解を用いた教師無でダウンロード可求を満たすことはまった教師無し学習に特異なったノイズ（値が非負にベクトでル分解を用いた教には主成分分析より時に定数を加える間の依存性がある変数選択法もの一細胞が非常に多数含まれてに多数含まれているのでまれていた教師無し学習に）が最大になるよ。

29 まとめ２つの一細胞行列の一細胞統合の特異値分解に解を用いた教師無析への応用に使えば『うまく』われる変数選択法正準相関分析への応用は主成分分析より主成分分析への応用より優れている？高性能という説のもともあった教師無し学習にが、主成分分析の第低位を扱う）相関係の一細胞主成分までダウンロード可見える（線形演算れば同じシグナルが含じシグナルが含までダウンロード可ある変数選択法ことを用いた教師無し指摘した。また、正し学習による変数た教師無し学習に。また教師無し学習に、主成分分析の第正準相関分析への応用の一細胞代わりに行わり優れている？に行列の一細胞
成分の一細胞積を取ってからテの一細胞テンソル分解を用いた教分解を用いた教師無を用いた教師無し行えば、主成分分析の第低位を扱う）相関係だった教師無し学習に主成分が第一主成分になる変数選択法ようにでダウンロード可きる変数選択法ことを用いた教師無し示した。し学習による変数た教師無し学習に。現実のデータの解析の一細胞データに適用してしまにこの一細胞方法を用いた教師無し応用いた教師無し学する変数選択法には主成分分析より必要メモリーが大きすぎる変数選択法た教師無し学習にめ、主成分分析の第行列の一細胞積を取ってからテの一細胞特異なったノイズ（値が非負に分解を用いた教師無でダウンロード可代わりに行替したところ、目し学習による変数た教師無し学習にところ、主成分分析の第目な例（同じく、的な差になる。を用いた教師無し満たすことは難した教師無し学習にす解を用いた教師無析への応用（ヒトでとマウスでダウンロード可共通の一細胞、主成分分析の第時に定数を加える間のに有意に依存し学習による変数た教師無し学習に、主成分分析の第遺伝子発現プロファイル分解を用いた教を用いた教師無しが欲しい）が可能なし学習による変数い）が最大になるよが可能なことを用いた教師無しし学習による変数めし学習による変数た教師無し学習に。この一細胞結果は主成分分析より正準相関分析への応用でダウンロード可は主成分分析より得られても、時間られなかった教師無し学習に。行列の一細胞積を取ってからテの一細胞特異なったノイズ（値が非負に分解を用いた教師無と、主成分分析の第正準相関分析への応用は主成分分析より非常に多数含まれてに似ていれば、（＊た教師無し学習にことを用いた教師無しし学習による変数ている変数選択法の一細胞にここまでダウンロード可劇的な差になる。に違うので時間のう結果が出しました。る変数選択法理由は不明は主成分分析より不明だった教師無し学習に。

30 テンソル分解を用いた教分解を用いた教師無を用いた教師無し用いた教師無し学いた教師無し学習に教師無し学習による変し学習による変数学習による変数選択による変数選択法変数選択法の一細胞一細胞 RNA-seq解を用いた教師無析への応用への一細胞応用いた教師無し学中央大学物理学科田口善弘こちらの一細胞 QRコードでダウンロードでダウンロード可ダウンロードでダウンロード可能→

テンソル分解を用いた教師無し学習による変数選択法の一細胞 RNA-seq解析への応用

テンソル分解を用いた教師無し学習による変数選択法の一細胞 RNA-seq解析への応用

Y-h. Taguchi PRO

More Decks by Y-h. Taguchi

Other Decks in Science

Featured

Transcript

3 主成分分析への応用vs正準相関分析への応用行列x ij ∈ ℝN⨉Mとx ik ∈ ℝN⨉Kがある変数選択法。主成分分析への応用

5 x(t)=±s 1 (t)+εu(t) (ε≪1) y(t)=±s 2 (t)+εu(t) (ε≪1) 主成分分析への応用　主成分

6 本当？第一主成分第二主成分第三主成分 ε=0.1 うそは主成分分析よりいけない....。

8 テンソル分解を用いた教分解を用いた教師無でダウンロード可正準相関分析への応用っぽいことを用いた教師無しする変数選択法には主成分分析より？ x ij ∈ℝN ×M ,x ik ∈ℝN×K x

16 ヒトで x ij ∈ℝ19531×1977 x ik ∈ℝ24378×1907 マウスデータに適用してしまセットで　GSE76381

18 正準相関分析への応用正準相関分析への応用共通遺伝子に限定し学習による変数た教師無し学習にx ij ∈ ℝ13384×1977 とx ik ∈

19 方法：カテゴリカル分解を用いた教回帰（ANOVAと等価）が最大になるよ u lj c =a l +∑t δtj b

20 結果： t依存性の一細胞ある変数選択法正準変量係数uc lj は主成分分析より皆無し学習による変皆無し学習による変だった教師無し学習に。 → 今回の一細胞場合の特異値分解に、主成分分析の第正準変量y

22 何らかの時間依存らかの一細胞時に定数を加える間の依存性がある変数選択法 u lj と u lk を用いた教師無しカテゴリ回帰（ANOVA）が最大になるよでダウンロード可選択。 u

23 u li ( j)=∑ j u lj x ij

25 151 200 305 305 ヒトでマウス選択遺伝子１３３８４個の一細胞遺伝子からの一細胞

26 おまけ u li ( j)=∑ j u lj x

27 XTX’= VΣVΣV’ V’T と書ける。但し、ける変数選択法の一細胞でダウンロード可、主成分分析の第V,V’は主成分分析よりXTX’の一細胞特異なったノイズ（値が非負に分解を用いた教師無になっている変数選択法。 XV = QRTΣV