Upgrade to Pro — share decks privately, control downloads, hide ads and more …

主成分分析及びテンソル分解を用いた教師無し学習による変数選択法とそのバイオインフォマティクスへの応用

Y-h. Taguchi
January 17, 2022

 主成分分析及びテンソル分解を用いた教師無し学習による変数選択法とそのバイオインフォマティクスへの応用

統計物理と統計科学の連続セミナー
https://sites.google.com/view/ismstatphys/

2022/1/17 17:00-

講演ビデオはこちら
https://youtu.be/u-WH4kdapHo

関連するプレプリントが公開されました。
https://doi.org/10.1101/2022.02.18.481115

Y-h. Taguchi

January 17, 2022
Tweet

More Decks by Y-h. Taguchi

Other Decks in Science

Transcript

  1. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 3 お断り(その1)断り(その1)り(そのバイオインフォ1) お断り(その1)断り(その1)り(そのバイオインフォ1) 提案と既存手法との手法とそのバイオイは遺伝子発現プロ遺伝子発現プロファイルをプロファイル分解を用いた教のバイオインフォ解を用いた教師無析のバイオインフォみならず、マルマル分解を用いた教 チオミックスへの応用解を用いた教師無析と言ってって遺伝子選択を行DNAのバイオインフォメチル分解を用いた教化やヒストン修飾やヒストン修飾なヒスへの応用トン修飾などなど のバイオインフォエピジェネティックスへの応用とのバイオインフォ統合解を用いた教師無析やヒストン修飾な、マル一細胞解を用いた教師無析と言ってって遺伝子選択を行 臓器単位ではなく、細胞では遺伝子発現プロなく、マル細胞単位ではなく、細胞でのバイオインフォ計測の解析にも適用のバイオインフォ解を用いた教師無析にも適用可能で適用いた教師無し学可能でで すが、マル今回は1時間しか無は遺伝子発現プロ1時間しか無いので遺し学習にか無いので遺伝子無し学習にいのバイオインフォで遺伝子発現プロファイルをプロファイル分解を用いた教のバイオインフォ解を用いた教師無

    析に的を絞って説明しを用いた教師無し絞って説明しますって遺伝子選択を行説明しますし学習にます
  2. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 5 問題設定 M個(被験者、マル培養細胞、マル動物etc) のバイオインフォN個のバイオインフォ遺伝子のバイオインフォ発現プロファイルを量を2つを用いた教師無し2つ (以上)のバイオインフォ条件下で計測した。で計測の解析にも適用し学習にた教師無し学習に。 条件に依存し学習にて遺伝子選択を行変化やヒストン修飾し学習にて遺伝子選択を行いる変数選択法とそ遺伝 子は遺伝子発現プロ何個(N 1

    )あって遺伝子選択を行、マルどれか無いので遺伝子? x ij :i番目の遺伝子ののバイオインフォ遺伝子のバイオインフォj番目の遺伝子ののバイオインフォサンプ ル分解を用いた教のバイオインフォ発現プロファイルを量を2つ。非負の整数(またはのバイオインフォ整数(また教師無し学習には遺伝子発現プロ 実数。計測の解析にも適用手段による)。による変数選択法とそ)。 N M A M B M=M A +M B N 1
  3. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 6 お断り(その1)断り(その1)り(そのバイオインフォ2) お断り(その1)断り(その1)り(そのバイオインフォ2) 「何個、マルのバイオインフォ情報までは要らないまでは遺伝子発現プロ要らないのでは?らないのバイオインフォでは遺伝子発現プロ?なんらか無いので遺伝子のバイオインフォ基準で順で順 位ではなく、細胞だけつけて遺伝子選択を行お断り(その1)き、マル必要らないのでは?な数だけ場合に応じて遺伝子選択を行利用いた教師無し学すればい いのバイオインフォでは遺伝子発現プロ?」という考えもあという考えも適用可能である変数選択法とそとは遺伝子発現プロ思う。う。 た教師無し学習にだ、マルここでは遺伝子発現プロ後述のように「生物のバイオインフォように「生物学的を絞って説明しに意味がある遺伝子がある変数選択法とそ遺伝子 を用いた教師無し選択し学習にた教師無し学習にい」という考えもあという要らないのでは?求がある。発現差がある変数選択法とそ。発現プロファイルを差があるからといがある変数選択法とそか無いので遺伝子らといって遺伝子選択を行

    生物学的を絞って説明しに意味がある遺伝子がある変数選択法とそとは遺伝子発現プロ勿論、マル限らないが、例えらないが、マル例えば、マル100 位ではなく、細胞のバイオインフォ遺伝子が条件AとBのバイオインフォ比較では遺伝子発現プロ意味がある遺伝子が有り、条件り、マル条件A’と B’では遺伝子発現プロ意味がある遺伝子がないです、マルとなる変数選択法とそと順位ではなく、細胞には遺伝子発現プロ意味がある遺伝子がないことに なる変数選択法とそのバイオインフォで極力「何個」という考えもあまで特定し学習にた教師無し学習にい。
  4. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 7 なぜ、マル条件に依存し学習にて遺伝子選択を行変化やヒストン修飾し学習にて遺伝子選択を行いる変数選択法とそ遺伝子を用いた教師無し知ることが重要かる変数選択法とそことが重要らないのでは?か無いので遺伝子? すべて遺伝子選択を行のバイオインフォ細胞は遺伝子発現プロ同じ遺伝子を持っじ遺伝子を用いた教師無し持っている。従っって遺伝子選択を行いる変数選択法とそ。従って、機能を変って遺伝子選択を行、マル機能でを用いた教師無し変える変数選択法とそ には遺伝子発現プロ選択的を絞って説明しに遺伝子を用いた教師無し組み合わせて機能み合わせて遺伝子選択を行機能でさせる変数選択法とそし学習にか無いので遺伝子ない。機能で する変数選択法とそた教師無し学習にめには遺伝子発現プロゲノムから読み出されか無いので遺伝子ら読み出されてタンみ出されてタンパクされて遺伝子選択を行タンパクに翻訳されないとされないと いけないのバイオインフォで、マルまずは遺伝子発現プロどのバイオインフォ遺伝子が発現プロファイルをし学習にて遺伝子選択を行いる変数選択法とそか無いので遺伝子を用いた教師無し知ることが重要かる変数選択法とそことが 第一歩。機能で既知ることが重要かのバイオインフォ遺伝子ならどんな機能でが発揮されているかされて遺伝子選択を行いる変数選択法とそか無いので遺伝子 解を用いた教師無る変数選択法とそし学習に、マル逆に機能が解ってに機能でが解を用いた教師無って遺伝子選択を行いる変数選択法とそ細胞で発現プロファイルをし学習にて遺伝子選択を行いる変数選択法とそ機能で未知ることが重要かのバイオインフォ

    遺伝子のバイオインフォ機能でを用いた教師無し推定できる変数選択法とそ場合も適用可能である変数選択法とそ(注:但し、実際に計測し学習に、マル実際に計測さに計測の解析にも適用さ れて遺伝子選択を行いる変数選択法とそのバイオインフォは遺伝子発現プロタンパクのバイオインフォ量を2つでは遺伝子発現プロなくゲノムから読み出されとタンパクのバイオインフォ中間しか無いので遺体でで ある変数選択法とそRNAのバイオインフォ量を2つである変数選択法とそ)
  5. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 8 なぜ、マルそれが(研究テーマになるほテーマになる変数選択法とそほど)難しいか?し学習にいか無いので遺伝子? 計測の解析にも適用技術的を絞って説明しな問題→今日の予定は遺伝子発現プロ触れません。れません。 x ij 既知ることが重要かのバイオインフォ場合でも適用可能でさらにまだ難しいか?し学習にい。 難しいか?し学習にい理由: Large

    p small n問題:A群が患者、が患者、マルB群が患者、が健常者、マルのバイオインフォ場合、マルA群が患者、とB群が患者、 で発現プロファイルを差があるからといがある変数選択法とそ遺伝子は遺伝子発現プロ病気の原因でありうのバイオインフォ原因でありうる。だでありうる変数選択法とそ。だが、マル通常、マル M(~10)<<N(~104)である変数選択法とそた教師無し学習にめ、マルN個のバイオインフォ遺伝子でM個のバイオインフォラベル分解を用いた教を用いた教師無し推 定する変数選択法とそという問題は遺伝子発現プロ不定(任意のバイオインフォM個のバイオインフォ遺伝子を用いた教師無し選択すれば必ず 推定できる変数選択法とそ、マル連立一次N変数方程式で式の数で式で式の数のバイオインフォ数M<Nのバイオインフォ場合に相当)。
  6. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 9 M個のバイオインフォラベル分解を用いた教を用いた教師無しN変数を用いた教師無し使って遺伝子選択って遺伝子選択を行推定する変数選択法とそという枠組み合わせて機能みで変数選 択を用いた教師無しする変数選択法とそとた教師無し学習にか無いので遺伝子だがM個のバイオインフォ変数し学習にか無いので遺伝子選べない(N=Mになった教師無し学習に時 点で線形回は1時間しか無帰モデルでも誤差モデル分解を用いた教でも適用可能で誤差があるからといゼロのバイオインフォモデル分解を用いた教が作れてしまうのれて遺伝子選択を行し学習にまうのバイオインフォ で)が、マル「2条件間しか無いので遺で発現プロファイルを量を2つに差があるからといがある変数選択法とそ遺伝子のバイオインフォ数」という考えもあがそのバイオインフォ時のバイオインフォ 実験で使って遺伝子選択うことが出されてタンパク来たサンプルの数た教師無し学習にサンプル分解を用いた教のバイオインフォ数Mより少ない保証は全くない保証は全くは遺伝子発現プロ全くく 無し学習にく、マルか無いので遺伝子つ、マルMは遺伝子発現プロ10程度と少ない。と少ない保証は全くない。

  7. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 10 n:サンプル分解を用いた教数,y i =0,1 二分類ラベルラベル分解を用いた教 x i :i番目の遺伝子ののバイオインフォサンプル分解を用いた教のバイオインフォ全く遺伝子のバイオインフォ発現プロファイルを量を2つのバイオインフォベクトル分解を用いた教

    β:各p遺伝子のバイオインフォ重みベクトル分解を用いた教 Zakariya Yahya Algamal, Muhammad Hisyam Lee Regularized logistic regression with adjusted adaptive elastic net for gene selection in high dimensional cancer classification Computers in Biology and Medicine Volume 67, 1 December 2015, Pages 136-145
  8. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 11 M N N 1 N>>M>N 1 た教師無し学習にか無いので遺伝子だか無いので遺伝子M個のバイオインフォ

    遺伝子し学習にか無いので遺伝子選択 できない。 いつも適用可能で選ばれる変数選択法とそのバイオインフォ は遺伝子発現プロ数遺伝子か無いので遺伝子ら 数十遺伝子程度と少ない。 で安定性の解析が悪い。い。
  9. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 12 現プロファイルを在の主流:のバイオインフォ主流: なんらか無いので遺伝子のバイオインフォ統計的を絞って説明しなテスへの応用ト(*)を用いた教師無し想定し学習に、マル2群が患者、(多群が患者、)で発現プロファイルを量を2つ に有り、条件意差があるからといがある変数選択法とそ遺伝子を用いた教師無し選択する変数選択法とそ。 発現プロファイルを量を2つに有り、条件意差があるからといがある変数選択法とそ遺伝子のバイオインフォ数N 1 も適用可能で推定対象。 (*)例えば、マル「2群が患者、のバイオインフォ発現プロファイルを量を2つには遺伝子発現プロ差があるからといがなく、マル同じ遺伝子を持っじ分布関数か無いので遺伝子ら確

    率的を絞って説明しなゆらぎを用いた教師無し持っている。従っって遺伝子選択を行発生する変数選択法とそ」という考えもあと仮定し学習にて遺伝子選択を行、マルこのバイオインフォ仮定(帰モデルでも誤差無し学習に仮 説)のバイオインフォも適用可能でとで実際に計測さのバイオインフォ遺伝子のバイオインフォ発現プロファイルを量を2つのバイオインフォ2群が患者、間しか無いので遺のバイオインフォ差があるからといのバイオインフォ大きさが偶 然出されてタンパク現プロファイルをする変数選択法とそ確率(P値と呼ばれる)をと呼ばれる)を計算ばれる変数選択法とそ)を用いた教師無し計算して、もし、そし学習にて遺伝子選択を行、マルも適用可能でし学習に、マルそのバイオインフォ確率が ありえないほど小さかったら「同さか無いので遺伝子った教師無し学習にら「同じ遺伝子を持っじ分布か無いので遺伝子ら出されてタンパク現プロファイルをし学習にた教師無し学習にとは遺伝子発現プロ思う。えな いのバイオインフォで2群が患者、には遺伝子発現プロ差があるからといがある変数選択法とそ」という考えもあと考える変数選択法とそ。
  10. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 13 まだ、マル問題がある変数選択法とそ。 Large p small n問題なのバイオインフォで、マル多重比較補正(各遺伝子に独立に推定 を用いた教師無し行うことのうのバイオインフォで試行うことの回は1時間しか無数が遺伝子数Nになる変数選択法とそのバイオインフォで確率1/Nでし学習にか無いので遺伝子起きなきな いことも適用可能で起きなきて遺伝子選択を行し学習にまうのバイオインフォで補正が必要らないのでは?。Nが大きければより厳しい補し学習にい補

    正=より小さなより小さかったら「同さなP値と呼ばれる)をが要らないのでは?求がある。発現差される変数選択法とそ)が必要らないのでは?な一方、マルMが少ない保証は全くないのバイオインフォでP 値と呼ばれる)をは遺伝子発現プロ大きめになりがち(10枚のコインを投げのバイオインフォコインを用いた教師無し投げて遺伝子選択を行全く部表になる確立はになる変数選択法とそ確立は遺伝子発現プロ 1/1024なのバイオインフォで全く部表になる確立はになった教師無し学習にらこのバイオインフォコインは遺伝子発現プロ裏表になる確立は同じ遺伝子を持っじ確率とは遺伝子発現プロ思う。 えない、マルと言ってえる変数選択法とそだろうが、マル2枚のコインを投げのバイオインフォコインなら2枚のコインを投げとも適用可能で表になる確立はになる変数選択法とそ確立は遺伝子発現プロ 1/4なのバイオインフォでとて遺伝子選択を行も適用可能で偶然じゃないとは遺伝子発現プロ言ってえないだろう)なのバイオインフォでN(=より小さな遺伝 子数=より小さな試行うことの数)が大きくM(=サンプル分解を用いた教数)が小さかったら「同さいと有り、条件意差があるからといがある変数選択法とそ とみなせる変数選択法とそほど十分小さかったら「同さなP値と呼ばれる)をを用いた教師無し得ることが出来なる変数選択法とそことが出されてタンパク来たサンプルの数ない(か無いので遺伝子も適用可能でし学習にれな い)。
  11. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 14 ※さらに、マル遺伝子発現プロファイルをプロファイル分解を用いた教だか無いので遺伝子ら起きなきる変数選択法とそ問題も適用可能である変数選択法とそ: た教師無し学習にとえばlog x ij のバイオインフォ分布を用いた教師無し考える変数選択法とそ(対数のバイオインフォ底は2。以下同じは遺伝子発現プロ2。以下で計測した。同じ遺伝子を持っじ)。 log x

    ij log x ij 遺伝子1と2は遺伝子発現プロ群が患者、間しか無いので遺のバイオインフォ差があるからといと群が患者、内のばらつきが同のバイオインフォばらつきが同じ遺伝子を持っじなのバイオインフォで二群が患者、のバイオインフォ差があるからとい のバイオインフォ程度と少ない。は遺伝子発現プロ同じ遺伝子を持っじである変数選択法とそ。し学習にか無いので遺伝子し学習に、マル下で計測した。のバイオインフォ方が総発現プロファイルを量を2つが大きい。遺伝子 発現プロファイルを量を2つは遺伝子発現プロ物質量を2つのバイオインフォ差があるからといなのバイオインフォで10と20のバイオインフォ差があるからといよりも適用可能で100と200のバイオインフォ差があるからといのバイオインフォ 方が起きなきにくいと思う。われる変数選択法とそがそれが全くく反映されていない。されて遺伝子選択を行いない。 A A B B 遺伝子1 遺伝子2
  12. 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 15 このバイオインフォあた教師無し学習にりは遺伝子発現プロベイズ統計的には事前統計的を絞って説明しには遺伝子発現プロ事前分布(「遺伝子のバイオインフォ発現プロファイルを量を2つは遺伝子発現プロ大 きい場合は遺伝子発現プロ出されてタンパク現プロファイルをし学習ににくい」という考えもあとか無いので遺伝子)で考慮できる変数選択法とそように思う。える変数選択法とそか無いので遺伝子も適用可能でし学習にれ ないがお断り(その1)そらくやヒストン修飾なりた教師無し学習にいのバイオインフォは遺伝子発現プロそういうことでは遺伝子発現プロなく「健常者のバイオインフォ発現プロファイルを 量を2つが10のバイオインフォ遺伝子が患者で20になる変数選択法とそよりも適用可能で健常者のバイオインフォ発現プロファイルを量を2つが100 のバイオインフォ遺伝子が患者で200になる変数選択法とそ方が難しいか?し学習にい」という考えもあみた教師無し学習にいな話なので、健なのバイオインフォで、マル健 常者のバイオインフォ発現プロファイルを量を2つを用いた教師無し条件にし学習にた教師無し学習に、マル患者のバイオインフォ発現プロファイルを量を2つのバイオインフォ条件付き分布き分布 P(患者|健常者) みた教師無し学習にいなことを用いた教師無し考えないといけないと思う。うがそういうことは遺伝子発現プロやヒストン修飾なられて遺伝子選択を行

    いないように思う。う(P(患者|健常者)は遺伝子発現プロ遺伝子ごとに違うと思われうと思う。われ る変数選択法とそが、マル患者と健常者には遺伝子発現プロ1対1対応がないのバイオインフォでP(患者、マル健常者)のバイオインフォ ような同じ遺伝子を持っ時確率分布は遺伝子発現プロ存在の主流:せず、マルある変数選択法とそのバイオインフォは遺伝子発現プロP(患者)とP(健常者) だけなのバイオインフォで計算して、もし、そ不能で)。
  13. 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 16 現プロファイルを在の主流:主流のバイオインフォ方法とそのバイオイ:DESeq2(本当は遺伝子発現プロも適用可能でっと複雑です)です) x ij ~ NB(μ i ,α i

    ), log μ i :ガウスへの応用分布、マルα α i i :小さかったら「同⇔ :小さかったら「同⇔μ μ i i :大(経験則) :大(経験則)。 NB:負の整数(またはのバイオインフォ二項分布(*),平均μと分散αを用いた教師無し自由に決められる正の値められる変数選択法とそ正のバイオインフォ値と呼ばれる)をし学習にか無いので遺伝子 取らない分布関数らない分布関数なのバイオインフォで採用いた教師無し学された教師無し学習にだけで意味がある遺伝子は遺伝子発現プロない。 P(x) = x+r-1 C x px(1-p)r μ:pr/(1-p), α:pr/(1-p)2=μ2/pr 確率pで表になる確立はが出されてタンパクる変数選択法とそコインについて遺伝子選択を行,r回は1時間しか無ウラが出されてタンパクる変数選択法とそまでのバイオインフォ表になる確立はが出されてタンパクる変数選択法とそ回は1時間しか無数 を用いた教師無し表になる確立はし学習にた教師無し学習にも適用可能でのバイオインフォ
  14. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 18 DESeq2のバイオインフォモデル分解を用いた教は遺伝子発現プロ主流のバイオインフォ解を用いた教師無析方法とそのバイオイを用いた教師無し説明しますする変数選択法とそと同じ遺伝子を持っ時に、マル世 のバイオインフォ中のバイオインフォ人が遺伝子発現プが遺伝子発現プロファイルをプロファイル分解を用いた教とは遺伝子発現プロどういう統計的を絞って説明しな性の解析 質を用いた教師無し持っている。従っって遺伝子選択を行いる変数選択法とそと信じているか、をじて遺伝子選択を行いる変数選択法とそか無いので遺伝子、マルを用いた教師無し表になる確立は現プロファイルをし学習にて遺伝子選択を行いる変数選択法とそ。 「発現プロファイルを差があるからといがある変数選択法とそ遺伝子」という考えもあは遺伝子発現プロx ij のバイオインフォ分布にNBを用いた教師無し仮定し学習にて遺伝子選択を行log x

    ij のバイオインフォ 群が患者、内のばらつきが同平均が群が患者、間しか無いので遺で有り、条件意差があるからといがある変数選択法とそか無いので遺伝子どうか無いので遺伝子を用いた教師無し「x ij は遺伝子発現プロ2群が患者、で共通 のバイオインフォNBか無いので遺伝子ら発生し学習にた教師無し学習に」という考えもあという帰モデルでも誤差無し学習に仮説を用いた教師無し棄却することで判定する変数選択法とそことで判定す る変数選択法とそ(実際に計測さは遺伝子発現プロも適用可能でっと複雑です)なことを用いた教師無しし学習にて遺伝子選択を行いますが、マル僕も理解していも適用可能で理解を用いた教師無し学習にて遺伝子選択を行い ません)。
  15. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 19 実際に計測さ、マルrnaseqcompというBioconductor(*)のバイオインフォパッケージには遺伝子発現プロこのバイオインフォよう な前提(x ij は遺伝子発現プロNBに従って、機能を変い、マルlog μは遺伝子発現プロガウスへの応用分布し学習にて遺伝子選択を行いる変数選択法とそ)で作れてしまうのられた教師無し学習に模 擬データデータsimdataが含まれており、こまれて遺伝子選択を行お断り(その1)り、マルこのバイオインフォデータを用いた教師無し使って遺伝子選択って遺伝子選択を行パイプラインを用いた教師無し 評価することが推奨する変数選択法とそことが推奨されている。されて遺伝子選択を行いる変数選択法とそ。

    Teng, Mingxiang, Michael I. Love, Carrie A. Davis, Sarah Djebali, Alexander Dobin, Brenton R. Graveley, et al. 2016. “A Benchmark for Rna-Seq Quantification Pipelines.” Genome Biology 17 (1): 74. IF=13のバイオインフォ雑です)誌だし、100回だし学習に、マル100回は1時間しか無以上引用いた教師無し学されて遺伝子選択を行いる変数選択法とそのバイオインフォでみんなこれでい いと思う。って遺伝子選択を行いる変数選択法とそんだと思う。う。 (*)遺伝子発現プロファイルをプロファイル分解を用いた教などのバイオインフォデータ解を用いた教師無析ソフトを用いた教師無し大量を2つに集めめ た教師無し学習にリポジトリ。
  16. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 20 遺伝子ごとのバイオインフォlog x ij のバイオインフォ平均 遺伝子ごとのバイオインフォlog x ij

    のバイオインフォ 平均のバイオインフォ二群が患者、間しか無いので遺のバイオインフォ差があるからとい 赤:二群が患者、に発現プロファイルを差があるからといがある変数選択法とそ遺伝子 密度と少ない。分布 15776遺伝子 8対8のバイオインフォ2群が患者、 simdata MAPlot
  17. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 24 Matthews's correlation coefficient(*) MCC 発現プロファイルを差があるからといありを用いた教師無し1,なし学習にを用いた教師無し0とし学習にた教師無し学習に時のバイオインフォ予測の解析にも適用と現プロファイルを実のバイオインフォ相関係数を用いた教師無し計算して、もし、そ し学習にた教師無し学習にも適用可能でのバイオインフォ。現プロファイルを実のバイオインフォ1と0のバイオインフォ比が50:50か無いので遺伝子ら大きくずれて遺伝子選択を行いる変数選択法とそ場合に は遺伝子発現プロ有り、条件効な指標。1か0な指標。1か無いので遺伝子0か無いので遺伝子どっちか無いので遺伝子のバイオインフォ数が非常に多い場合には遺伝子発現プロ数が 多い方を用いた教師無し「全く部1」という考えもあとか無いので遺伝子「全く部0」という考えもあと予測の解析にも適用し学習にて遺伝子選択を行し学習にまうことで見た目上た教師無し学習に目の遺伝子の上

    のバイオインフォ正解を用いた教師無率が上がって遺伝子選択を行し学習にまうがMCCでこれを用いた教師無しやヒストン修飾なる変数選択法とそと「全く部0」という考えもあやヒストン修飾な「全く 部1」という考えもあのバイオインフォ方は遺伝子発現プロ分散がゼロになって遺伝子選択を行し学習にまうのバイオインフォで予測の解析にも適用と現プロファイルを実のバイオインフォ相関が なくなって遺伝子選択を行し学習にまう(0)のバイオインフォでMCCが小さかったら「同さくなって遺伝子選択を行し学習にまうことで「全く部 0」という考えもあやヒストン修飾な「全く部1」という考えもあと予測の解析にも適用する変数選択法とそことにペナル分解を用いた教ティを用いた教師無し課せる。完全一致せる変数選択法とそ。完全く一致はは遺伝子発現プロ MCCが1,完全く不一致は(現プロファイルを実が0のバイオインフォも適用可能でのバイオインフォが全く部1と予測の解析にも適用され、マル現プロファイルを実 が1のバイオインフォも適用可能でのバイオインフォは遺伝子発現プロ全く部0と予測の解析にも適用される変数選択法とそ)は遺伝子発現プロMCCが−1になる変数選択法とそ。今回は1時間しか無のバイオインフォ場 合、マル約16000個のバイオインフォ遺伝子のバイオインフォうち約2500個だけが「発現プロファイルを差があるからといあり」という考えもあ に設定されて遺伝子選択を行いる変数選択法とそのバイオインフォで1のバイオインフォ割合が小さかったら「同さく、マルMCCを用いた教師無し使って遺伝子選択うのバイオインフォが合理的を絞って説明し。
  18. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 25 し学習にきい値と呼ばれる)をのバイオインフォP値と呼ばれる)をを用いた教師無し変えた教師無し学習にらどうなる変数選択法とそ?→AUC 発現プロファイルを差があるからといなし学習にのバイオインフォ遺伝子のバイオインフォうち発現プロファイルを差があるからといありと間しか無いので遺違うと思われって遺伝子選択を行予測の解析にも適用された教師無し学習に割合 発現プロファイルを差があるからといありのバイオインフォ遺伝子のバイオインフォうち発現プロファイルを 差があるからといありと正し学習にく予測の解析にも適用された教師無し学習に割合 P=0 P=1 こういうグラフを用いた教師無しROC曲

    線という。赤い実線のバイオインフォ下で計測した。 のバイオインフォ面積をを用いた教師無しAUCと呼ばれる)を計算ぶ。完 全くな予測の解析にも適用ならAUC=1.0 になる変数選択法とそ。予測の解析にも適用と現プロファイルを実が無し学習に 相関なら赤い線は遺伝子発現プロ直線 になる変数選択法とそのバイオインフォで(縦軸=より小さな横軸 なのバイオインフォで)AUC=0.5(赤い 点線)になる変数選択法とそ。
  19. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 26 し学習にか無いので遺伝子し学習に、マルこれは遺伝子発現プロ自家発電(自分で問題作れてしまうのって遺伝子選択を行自分で解を用いた教師無い て遺伝子選択を行いる変数選択法とそだけ)なのバイオインフォでは遺伝子発現プロ、マルという気の原因でありうも適用可能でする変数選択法とそ。ところが、マル現プロファイルを実のバイオインフォ データのバイオインフォ場合「本当に発現プロファイルを差があるからといがある変数選択法とそ遺伝子は遺伝子発現プロどれなのバイオインフォ か無いので遺伝子?」という考えもあという答えがあるわけでえがある変数選択法とそわけでは遺伝子発現プロないのバイオインフォで、マル提案と既存手法とのし学習にた教師無し学習に方法とそのバイオイ (このバイオインフォ場合DESeq2)が「正し学習にい」という考えもあのバイオインフォか無いので遺伝子「間しか無いので遺違うと思われって遺伝子選択を行いる変数選択法とそ」という考えもあのバイオインフォ か無いので遺伝子判断り(その1)のバイオインフォし学習にようがない。それでも適用可能でとりあえずやヒストン修飾なって遺伝子選択を行みよう。

  20. 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 27     付き分布記 実は遺伝子発現プロSAM(*)というも適用可能でっと昔からある、か無いので遺伝子らある変数選択法とそ、マルNBを用いた教師無し仮定し学習にない方法とそのバイオイでやヒストン修飾なっ て遺伝子選択を行も適用可能でこのバイオインフォデータだと十分に「正し学習にく」という考えもあ発現プロファイルを差があるからといがある変数選択法とそ遺伝子を用いた教師無し特定でき る変数選択法とそのバイオインフォで「あのバイオインフォ小さかったら「同難しいか?し学習にい理屈はなんだったのは遺伝子発現プロなんだった教師無し学習にのバイオインフォ?」という考えもあというお断り(その1)気の原因でありう持っている。従っちは遺伝子発現プロ拭ええ ない(補正P値と呼ばれる)を<0.1)。 現プロファイルを実  発現プロファイルを差があるからといなし学習に 発現プロファイルを差があるからといあり 予測の解析にも適用 発現プロファイルを差があるからといなし学習に

    9216 485    発現プロファイルを差があるからといあり 1225 1899 Matthews's correlation coefficient(*) 0.5977025 AUC=0.89 simdata SAM
  21. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 28 SAM 基本的を絞って説明しにt検定(絶対値と呼ばれる)をが小さかったら「同さいのバイオインフォにP値と呼ばれる)をが小さかったら「同さいも適用可能でのバイオインフォが選ばれ る変数選択法とそことを用いた教師無し防ぐために分散にぐた教師無し学習にめに分散に定数を用いた教師無し加えている)。えて遺伝子選択を行いる変数選択法とそ)。permutationを用いた教師無しし学習にて遺伝子選択を行 差があるからといを用いた教師無し計算して、もし、そし学習に直し学習に、マルpermutationし学習にて遺伝子選択を行も適用可能で有り、条件意差があるからといが出されてタンパクて遺伝子選択を行し学習にまうようなも適用可能でのバイオインフォ は遺伝子発現プロ間しか無いので遺違うと思われって遺伝子選択を行有り、条件意差があるからといがある変数選択法とそと判定された教師無し学習にとし学習にて遺伝子選択を行排除する。する変数選択法とそ。 いずれにせよ、マルNBなんて遺伝子選択を行どこにも適用可能で出されてタンパクて遺伝子選択を行こない。 https://www.raybiotech.com/learning-center/sam/

  22. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 29 現プロファイルを実のバイオインフォデータでDESeq2のバイオインフォパフォーマンスへの応用を用いた教師無し確認 MAQC(*)というキャリブレーション用いた教師無し学のバイオインフォデータ。人が遺伝子発現プ間しか無いので遺のバイオインフォ臓器のバイオインフォ ミックスへの応用を用いた教師無しコントロール分解を用いた教とし学習にて遺伝子選択を行脳のデータを操作のバイオインフォデータを用いた教師無し操作れてしまうの群が患者、とし学習にて遺伝子選択を行発現プロファイルを差があるからといのバイオインフォ ある変数選択法とそ遺伝子を用いた教師無し探す。サンプルはす。サンプル分解を用いた教は遺伝子発現プロ7対7対7対7 7対7対7対7。提供されているのはされて遺伝子選択を行いる変数選択法とそのバイオインフォは遺伝子発現プロ生デー タでそこか無いので遺伝子ら遺伝子発現プロファイルを量を2つに変換するのは田口がする変数選択法とそのバイオインフォは遺伝子発現プロ田口がやヒストン修飾なった教師無し学習にのバイオインフォでそ こは遺伝子発現プロ注意が必要らないのでは?(まあ、マルでも適用可能で信じているか、を用いた教師無し学し学習にて遺伝子選択を行ください)。

    遺伝子数は遺伝子発現プロ40933 40933遺伝子 遺伝子(タンパクに翻訳されないとされない非コード RNAと呼ばれる)を計算ばれる変数選択法とそRNAも適用可能でた教師無し学習にくさん含まれており、こまれて遺伝子選択を行います) (*)https://www.fda.gov/science-research/bioinformatics-tools/ microarraysequencing-quality-control-maqcseqc
  23. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 30 遺伝子ごとのバイオインフォlog x ij のバイオインフォ平均 遺伝子ごとのバイオインフォlog x ij

    のバイオインフォ 平均のバイオインフォ二群が患者、間しか無いので遺のバイオインフォ差があるからとい simdadaより発現プロファイルを差があるからといが大きい。 高発現プロファイルを差があるからとい群が患者、のバイオインフォピークは遺伝子発現プロない MAQC 点のバイオインフォ平面頻度と少ない。分布
  24. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 33 遺伝子ごとのバイオインフォlog x ij のバイオインフォ平均 遺伝子ごとのバイオインフォlog x ij

    のバイオインフォ 平均のバイオインフォ二群が患者、間しか無いので遺のバイオインフォ差があるからとい 赤:二群が患者、に発現プロファイルを差があるからといがある変数選択法とそ遺伝子 MAQC log x ij のバイオインフォ群が患者、間しか無いので遺差があるからといのバイオインフォ絶対値と呼ばれる)をが 1以上のバイオインフォ物に限らないが、例え定 DESeq2
  25. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 34 log x ij のバイオインフォ群が患者、間しか無いので遺差があるからといのバイオインフォ絶対値と呼ばれる)をが1以上のバイオインフォ物に限らないが、例え定(補正P値と呼ばれる)を<0.1) 予測の解析にも適用 発現プロファイルを差があるからといなし学習に 27994   

    発現プロファイルを差があるからといあり 12465 発現プロファイルを差があるからといありのバイオインフォも適用可能でのバイオインフォは遺伝子発現プロ減った。った教師無し学習に。 発現プロファイルを差があるからといありが発現プロファイルをのバイオインフォ上昇と下降の2クラと下で計測した。降の2クラスターのバイオインフォ2クラスへの応用ターになった教師無し学習に。 →simdataに近くなった。大体くなった教師無し学習に。大体で、マルどのバイオインフォ論文も「も適用可能で「log x ij のバイオインフォ群が患者、間しか無いので遺差があるからといのバイオインフォ絶 対値と呼ばれる)をが1以上のバイオインフォ物に限らないが、例え定」という考えもあを用いた教師無しやヒストン修飾なって遺伝子選択を行いる変数選択法とそ(慣習にとし学習にて遺伝子選択を行)。 し学習にか無いので遺伝子し学習に、マルこれは遺伝子発現プロヤラセなのでは…。なのバイオインフォでは遺伝子発現プロ…。 DESeq2 MAQC
  26. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 36 MAQCのバイオインフォデータを用いた教師無し主成分分析(PCA)し学習にて遺伝子選択を行みた教師無し学習に。 PCAとは遺伝子発現プロ? M次元空間しか無いので遺にN個のバイオインフォ点のバイオインフォ分布があった教師無し学習にとする変数選択法とそ。分布は遺伝子発現プロ実際に計測さには遺伝子発現プロ M 1 (<M)次元程度と少ない。のバイオインフォ多様体でであった教師無し学習にとする変数選択法とそ。PCAは遺伝子発現プロM次元内のばらつきが同のバイオインフォ点 のバイオインフォ分布を用いた教師無し回は1時間しか無転と並進だけでと並進だけでだけでM

    1 次元に埋め込める部分空め込める部分空間をめる変数選択法とそ部分空間しか無いので遺を用いた教師無し探す。サンプルはす 方法とそのバイオイ。そのバイオインフォ際に計測さ、マルM 1 次元のバイオインフォM 1 本のバイオインフォ軸は遺伝子発現プロ分散が大きい順に選ばれる変数選択法とそ。 但し、実際に計測し学習に、マル普通は遺伝子発現プロM個のバイオインフォサンプル分解を用いた教を用いた教師無しPCAする変数選択法とそが逆に機能が解ってにN個のバイオインフォ遺伝子を用いた教師無し PCAする変数選択法とそ。
  27. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 37 ∑ i x ij =0 ∑i x

    ij 2 =N ∑j' (∑i x ij x ij ' )v lj ' =λl v lj u li =∑j x ij v lj 数式で式の数のバイオインフォ方が解を用いた教師無る変数選択法とそと言ってう人が遺伝子発現プ向けけ 平均ゼロ 分散1 相関係数行うことの列の対角化のバイオインフォ対角化やヒストン修飾,サンプル分解を用いた教jに 付き分布与の臓器依存性のされる変数選択法とそ主成分負の整数(または荷量を2つv lj のバイオインフォ計算して、もし、そ 遺伝子iに付き分布与の臓器依存性のされる変数選択法とそ主成分得ることが出来な点u li のバイオインフォ計算して、もし、そ
  28. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 39 v 1j v 2j MAQC 対数を用いた教師無しとって遺伝子選択を行いる変数選択法とそわけでは遺伝子発現プロないが.... log

    x ij のバイオインフォ平均に相当 log x ij のバイオインフォ平均のバイオインフォ二群が患者、間しか無いので遺のバイオインフォ差があるからといに相当 だか無いので遺伝子らMAPlotに相当 PCA
  29. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 44 u 1i u 2i 赤:二群が患者、に発現プロファイルを差があるからといがある変数選択法とそ遺伝子 l=1 l=2

    累積を寄与の臓器依存性の率 2次元に埋め込める部分空め込める部分空間をめて遺伝子選択を行は遺伝子発現プロいる変数選択法とそがu 2i のバイオインフォ値と呼ばれる)をが大きいところに発現プロファイルを差があるからといのバイオインフォある変数選択法とそ 遺伝子がいる変数選択法とそわけでは遺伝子発現プロない。 simdata PCA
  30. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 48 MAQC し学習にきい値と呼ばれる)を P<0.01 予測の解析にも適用 発現プロファイルを差があるからといなし学習に 40665    発現プロファイルを差があるからといあり 298

    数が少ない保証は全くなすぎる変数選択法とそようにも適用可能で思う。える変数選択法とそが、マル分野的を絞って説明しに選ばれる変数選択法とそ 遺伝子は遺伝子発現プロ少ない保証は全くないほうが嬉しい。し学習にい。 PCA
  31. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 49 u 1i u 2i MAQC 赤:補正P<0.01 PCAのバイオインフォ埋め込める部分空め込める部分空間をみ空間しか無いので遺的を絞って説明しに

    は遺伝子発現プロ外れ値をうまく選れ値と呼ばれる)をを用いた教師無しうまく選べて遺伝子選択を行い る変数選択法とそように見た目上える変数選択法とそ。 MAPlotも適用可能で何か無いので遺伝子明します確な根拠 があって遺伝子選択を行描かれているわけか無いので遺伝子れて遺伝子選択を行いる変数選択法とそわけ では遺伝子発現プロないのバイオインフォでPCAのバイオインフォ方が だめとは遺伝子発現プロ言ってえないのバイオインフォでは遺伝子発現プロ? PCA
  32. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 51 Term Count % PValue Benjamini Pop Hits

    Brain 190 73.35 1.17E-26 2.11E-24 8256 Fetal brain cortex 36 13.89 7.78E-25 4.83E-23 271 Cajal-Retzius cell 34 13.12 8.00E-25 4.83E-23 232 Brain cortex 15 5.79 1.15E-09 5.22E-08 127 MAQC これ以上は遺伝子発現プロ判断り(その1)できないのバイオインフォで、マル既知ることが重要かのバイオインフォ「脳のデータを操作で発現プロファイルをが上がって遺伝子選択を行い る変数選択法とそ遺伝子と比べて遺伝子選択を行みた教師無し学習に(*)。か無いので遺伝子なりよく一致はし学習にて遺伝子選択を行いる変数選択法とそ。 (*)DAVID 6.8 https://david.ncifcrf.gov/ PCA
  33. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 52 Term Count % PValue Benjamini Pop Hits

    Brain 5928 43.16 1.94E-91 1.22E-88 8256 Epithelium 2039 14.84 4.55E-26 1.43E-23 2816 Amygdala 485 3.53 2.86E-16 6.00E-14 615 Fetal brain 606 4.41 3.61E-15 5.66E-13 791 MAQC DESeq2で選んだ遺伝子と比べて遺伝子選択を行みる変数選択法とそと2番めに脳のデータを操作と全く然 関係無し学習にいも適用可能でのバイオインフォを用いた教師無し拾ってしまっていって遺伝子選択を行し学習にまって遺伝子選択を行いる変数選択法とそし学習に、マルそも適用可能でそも適用可能で、マル脳のデータを操作で発現プロファイルをし学習に て遺伝子選択を行いる変数選択法とそ遺伝子が1万個以上も適用可能である変数選択法とそも適用可能でのバイオインフォなのバイオインフォだろうか無いので遺伝子? DESeq2
  34. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 53 MAQC Category Term Count % PValue Pop

    Hits UP_TISSUE Brain 219 75.25 2.19E-36 8256 UP_TISSUE Amygdala 46 15.80 9.59E-20 615 UP_TISSUE Fetal brain cortex 26 8.93 1.46E-13 271 UP_TISSUE Cajal-Retzius cell 24 8.24 3.15E-13 232 UP_TISSUE Hippocampus 23 7.90 1.06E-06 467 UP_TISSUE Fetal brain 31 10.65 1.14E-06 791 UP_TISSUE Brain cortex 12 4.12 2.11E-06 127 ちなみにDESeq2でも適用可能でP値と呼ばれる)をが小さかったら「同さい上位ではなく、細胞300個ならOK。 1)なぜ300個なのバイオインフォか無いので遺伝子?(今は遺伝子発現プロPCAで選んだ数で選択) 2)いつも適用可能でうまくいくか無いので遺伝子? という問題は遺伝子発現プロ残るる変数選択法とそ DESeq2
  35. 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 56 ちなみに、マル当然ある変数選択法とそ質問とし学習にて遺伝子選択を行「log x ij にし学習にて遺伝子選択を行か無いので遺伝子らPCAすればよくね?」という考えもあとい う疑問が想定されますが、マルこれは遺伝子発現プロあまりよろし学習にくないです。確か無いので遺伝子に対数 とって遺伝子選択を行か無いので遺伝子らPCAすれば散布図はは遺伝子発現プロMAPlotのバイオインフォ様になる変数選択法とそし学習に、マルv 1j ,v

    2j のバイオインフォ形も適用可能で同じ遺伝子を持っじに なる変数選択法とそのバイオインフォですが、マルそうなる変数選択法とそと本当に比だけが問題になって遺伝子選択を行し学習にまい1:2と10 0:200が「同じ遺伝子を持っじ発現プロファイルを差があるからといを用いた教師無しも適用可能でつ遺伝子」という考えもあとし学習にて遺伝子選択を行選ばれて遺伝子選択を行し学習にまいます。 DESeq2では遺伝子発現プロこれを用いた教師無し防ぐために分散にぐた教師無し学習にめにNBにお断り(その1)いて遺伝子選択を行μ(平均)が小さかったら「同さければα(分 散)が大きい、マルというモデル分解を用いた教を用いた教師無し導入しています。分し学習にて遺伝子選択を行います。分散が大きければ同じ遺伝子を持っじ比 でも適用可能でP値と呼ばれる)をは遺伝子発現プロ大きくなり選ばれにくくなります。対数を用いた教師無し取らない分布関数らない素ののバイオインフォPCAで は遺伝子発現プロ絶対値と呼ばれる)をを用いた教師無し残るし学習にて遺伝子選択を行ある変数選択法とそのバイオインフォで絶対値と呼ばれる)をが大きい方がu 2i も適用可能で大きくなる変数選択法とそのバイオインフォで「絶 対値と呼ばれる)をが小さかったら「同さいも適用可能でのバイオインフォがP値と呼ばれる)をが小さかったら「同さい」という考えもあという効な指標。1か0果を用いた教師無し自然に取らない分布関数り込める部分空間をんでいる変数選択法とそ のバイオインフォで、マルDESeq2とのバイオインフォ齟齬が減るものと思が減った。る変数選択法とそも適用可能でのバイオインフォと思う。われます。た教師無し学習にだ、マル僕も理解していか無いので遺伝子らする変数選択法とそとPCA のバイオインフォ方が「真実」という考えもあでDESeq2は遺伝子発現プロそれを用いた教師無しうまく取らない分布関数り込める部分空間をむように 「手で」という考えもあつくられ た教師無し学習にんじゃないか無いので遺伝子なー(PCAが地動説でDESeq2は遺伝子発現プロ天動説に相当)と疑っ て遺伝子選択を行います。
  36. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 60 MAQC log |u 2i | log |u

    2i | PCA 対数変換するのは田口が後PCA DESeq2による変数選択法とそ統計量を2つのバイオインフォ対数 2群が患者、のバイオインフォ差があるからといが 大 2群が患者、のバイオインフォ差があるからといが 大 雑です)には遺伝子発現プロ二群が患者、のバイオインフォ 発現プロファイルを差があるからといのバイオインフォ対数 logPCA PCA DESeq2
  37. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 61 MAQC x 1− 1 √2π ∫x ∞

    exp(− x2 2 ) log |u 2i | 1-P DESeq2による変数選択法とそ 統計量を2つのバイオインフォ対数 1-P 基本ガウスへの応用分布 logPCA PCA DESeq2
  38. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 62 PCAとDESeq2のバイオインフォランキングで上位ではなく、細胞のバイオインフォ遺伝子が一致はし学習にて遺伝子選択を行いる変数選択法とそ 理由のバイオインフォ雑です)な考察 二群が患者、のバイオインフォ発現プロファイルを量を2つのバイオインフォ平均がそれぞれx,yとする変数選択法とそ。 PCAのバイオインフォ基準で順:Δ=より小さなx-yのバイオインフォ絶対値と呼ばれる)を DESeq2のバイオインフォ基準で順: LFC= log

    (x/y) = log (1+Δ/y)のバイオインフォ絶対値と呼ばれる)を Δやヒストン修飾なLFCのバイオインフォ絶対値と呼ばれる)をが大きいところし学習にか無いので遺伝子選択されないのバイオインフォでLFC とΔのバイオインフォ正負の整数(またはは遺伝子発現プロ一致はし学習にて遺伝子選択を行いる変数選択法とそとし学習によう。Δ=y(exp(LFC)-1)なのバイオインフォで yが同じ遺伝子を持っじならLFCとΔのバイオインフォランキングは遺伝子発現プロ一致はし学習にて遺伝子選択を行いる変数選択法とそ
  39. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 63 遺伝子ごとのバイオインフォlog x ij のバイオインフォ平均 遺伝子ごとのバイオインフォlog x ij

    のバイオインフォ 平均のバイオインフォ二群が患者、間しか無いので遺のバイオインフォ差があるからとい cf. LFC= log (1+Δ/y) PCA DESeq2 MAQC 赤:上位ではなく、細胞5000 遺伝子 同じ遺伝子を持っじLFCならyが大きい方がΔが大きくなりやヒストン修飾なすいがこれは遺伝子発現プロDESeq2 でlog(x+y)〜log μが大きいとα(分散)が小さかったら「同さい、マルとし学習にて遺伝子選択を行いた教師無し学習にのバイオインフォと定性の解析 的を絞って説明しに一致は(分散が小さかったら「同さいと実効な指標。1か0的を絞って説明しなLFCが大きめに評価することが推奨される変数選択法とそ)。
  40. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 65 SEQC 人が遺伝子発現プ工的を絞って説明しに発現プロファイルを差があるからといを用いた教師無し 与の臓器依存性のえた教師無し学習に遺伝子 Spike in (ERCC) ベンチ

    マーク。 PCAは遺伝子発現プロDESeq2より ちょっと良いが、いずいが、マルいず れにせよ設定がハー ドすぎて遺伝子選択を行(決められる正の値し学習にて遺伝子選択を行 ERCCがも適用可能でっとも適用可能で発 現プロファイルを差があるからといが多いというわ けでも適用可能でない)AUCのバイオインフォ 値と呼ばれる)を自体では遺伝子発現プロ良いが、いずくない。 PCA DESeq2 platform site ERCC genes samples PCA DESeq2 ILM BGI 43 14261 80 vs 80 0.61 0.52 ILM AGR 51 15601 64 vs 64 0.60 0.51 ILM CNL 42 14028 75 vs 75 0.61 0.55 ILM COH 48 16224 32 vs 32 0.56 0.52 ILM MAY 43 13753 80 vs 80 0.63 0.56 ILM NVS 51 15600 64 vs 64 0.59 0.56 LIF LIV 61 16135 10 vs 10 0.61 0.56 LIF NWU 43 11842 60 vs 60 0.66 0.56 LIF PSU 40 10745 60 vs 60 0.67 0.58 LIF SQW 44 11659 60 vs 60 0.69 0.64 ROC MGP 32 11055 2 vs 2 0.62 0.62 ROC NYU 36 11672 2 vs 2 0.68 0.67 ROC SQW 34 10613 2 vs 2 0.68 0.70 AUC
  41. 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 66 「遺伝子を用いた教師無しPCAで埋め込める部分空め込める部分空間をんで群が患者、間しか無いので遺に差があるからといがある変数選択法とそ主成分寄与の臓器依存性の率(サン プル分解を用いた教に付き分布与の臓器依存性のされた教師無し学習にベクトル分解を用いた教)を用いた教師無しみつけ、マルそれに対応する変数選択法とそ主成分得ることが出来な点 (遺伝子に付き分布与の臓器依存性のされた教師無し学習にベクトル分解を用いた教)が正規分布に従って、機能を変うという帰モデルでも誤差無し学習に仮説 で遺伝子にP値と呼ばれる)をを用いた教師無し付き分布与の臓器依存性のし学習に、マル多重比較補正し学習にて遺伝子選択を行し学習にきい値と呼ばれる)を(経験的を絞って説明しに0. 01が多い)以下で計測した。のバイオインフォP値と呼ばれる)をのバイオインフォ遺伝子を用いた教師無し選んで有り、条件意差があるからといがある変数選択法とそとみなす」という考えもあ というプロトコル分解を用いた教を用いた教師無し考えた教師無し学習にわけで、マルこれは遺伝子発現プロ一般的を絞って説明しに ※DESeq2のバイオインフォような伝統的を絞って説明しな方法とそのバイオイに比べる変数選択法とそと非常に少ない保証は全く数個のバイオインフォ遺伝 子し学習にか無いので遺伝子選べない

    が、マル ※生物学的を絞って説明しには遺伝子発現プロ意味がある遺伝子がある変数選択法とそ(濃縮された)セットされた教師無し学習に)セなのでは…。ットである変数選択法とそことが多い ことが経験的を絞って説明しに解を用いた教師無って遺伝子選択を行お断り(その1)り、マルこのバイオインフォプロトコル分解を用いた教でいろいろな応用いた教師無し学論文も「 を用いた教師無し書いたきまし学習にた教師無し学習にが、マル今回は1時間しか無は遺伝子発現プロ時間しか無いので遺がないのバイオインフォで省略して、テンソルし学習にて遺伝子選択を行、マルテンソル分解を用いた教分解を用いた教師無のバイオインフォ 話なので、健を用いた教師無しし学習にます。
  42. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 67 テンソル分解を用いた教分解を用いた教師無 PCAと違うと思われって遺伝子選択を行、マル直感じになって的を絞って説明しな説明しますができないのバイオインフォでうまく説明しますできませ ん。数学的を絞って説明しには遺伝子発現プロ という展開のことを言いまのバイオインフォことを用いた教師無し言っています。x ijk は遺伝子発現プロN×M×Kのバイオインフォ次元を用いた教師無しも適用可能で ち、マルu

    l1i ,u l2j ,u l3k ,は遺伝子発現プロそれぞれ、マルN,M,K次元のバイオインフォベクトル分解を用いた教です。要らないのでは?する変数選択法とそに N×M×K次元のバイオインフォテンソル分解を用いた教を用いた教師無しN,M,K次元のバイオインフォベクトル分解を用いた教のバイオインフォ直積をで表になる確立は現プロファイルをし学習に た教師無し学習に項で展開のことを言いまする変数選択法とそ、マルというだけです。添字の数は3つ以上のバイオインフォ数は遺伝子発現プロ3つ以上も適用可能で可です。 x ijk =∑ l 1 l 2 l 3 G (l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k
  43. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 68 ここで時間しか無いので遺があった教師無し学習にらいろいろなテンソル分解を用いた教分解を用いた教師無のバイオインフォレビューを用いた教師無し すればいいのバイオインフォだが、マル時間しか無いので遺がないのバイオインフォで自分のバイオインフォ研究テーマになるほに使って遺伝子選択った教師無し学習に バージョンについて遺伝子選択を行だけ説明しますする変数選択法とそ。 原点 SVD PCA 特異値と呼ばれる)を分解を用いた教師無(SVD):

    PCAとよくにて遺伝子選択を行いる変数選択法とそが、マル 違うと思われいは遺伝子発現プロ平均ゼロ、マル分散1 にし学習にて遺伝子選択を行か無いので遺伝子ら部分空間しか無いので遺を用いた教師無し 求がある。発現差める変数選択法とそわけでは遺伝子発現プロない点。 なのバイオインフォで原点か無いので遺伝子らのバイオインフォ距離 も適用可能で含まれており、こめて遺伝子選択を行のバイオインフォ構造を考えを用いた教師無し考え た教師無し学習に場合のバイオインフォ部分空間しか無いので遺を用いた教師無し選 ぶことになる変数選択法とそ。
  44. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 69 HOSVD 僕も理解していが研究テーマになるほで使って遺伝子選択うアル分解を用いた教ゴリズ統計的には事前ムから読み出されは遺伝子発現プロ極めて遺伝子選択を行簡単でSVDのバイオインフォ高次元 版。N×M×Kのバイオインフォテンソル分解を用いた教を用いた教師無しN行うことのM×K列の対角化のバイオインフォ行うことの列の対角化とみなし学習にて遺伝子選択を行SVDを用いた教師無し実 行うことのし学習に、マルiに付き分布与の臓器依存性のされる変数選択法とそN次元のバイオインフォベクトル分解を用いた教u l1i を用いた教師無し求がある。発現差める変数選択法とそ。同じ遺伝子を持っじようにし学習に て遺伝子選択を行u

    l2j ,u l3k も適用可能で計算して、もし、そし学習に、マル最後に辻褄が合うようにが合うようにG(l 1 ,l 2 ,l 3 )を用いた教師無し計算して、もし、そする変数選択法とそ という極めて遺伝子選択を行シンプル分解を用いた教なアル分解を用いた教ゴリズ統計的には事前ムから読み出されです。 一般には遺伝子発現プロiがN個のバイオインフォ遺伝子を用いた教師無し、マルjがM人が遺伝子発現プのバイオインフォ被験者を用いた教師無し、マルkがK種類ラベルのバイオインフォ 臓器を用いた教師無し表になる確立は現プロファイルをする変数選択法とそ、マルみた教師無し学習にいな使って遺伝子選択い方を用いた教師無しし学習にます。
  45. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 70 x ijk G u l1i u l2j

    u l3k L1 L2 L3 HOSVD (Higher Order Singular Value Decomposition) N M K x ijk ≃∑ l 1 =1 L 1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 G(l 1 l 2 l 3 )u l 1 i u l 2 j u l 3 k N: 遺伝子数 (I),M: サンプル分解を用いた教数 (j), K: 臓器数 (k) xijk: 遺伝子 例 手法とそのバイオイ:テンソル分解を用いた教分解を用いた教師無
  46. 72 i:genes ul1i tDEG: tissue specific Differentially Expressed Genes 臓器特異的を絞って説明しに発現プロファイルを差があるからといがある変数選択法とそ遺伝子

    健常者 < 患者 tDEG: tDEG: 健常者 > 患者 とある変数選択法とそ l1 が |G(l1l2l3)|最大である変数選択法とそとする変数選択法とそ If G(l1l2l3)>0 固定
  47. 78 x i jk m ≃∑ l 1 =1 L

    1 ∑ l 2 =1 L 2 ∑ l 3 =1 L 3 ∑ l 4 =1 L 4 G(l 1 l 2 l 3 l 4 )u l 1 j u l 2 k u l 3 m u l 4 i u l1j : l 1 種類の肺がんの培養目の培養細胞依存の応用に興味があ培養細胞に依存性 u l2k : l 2 種類の肺がんの培養目の培養細胞依存の応用に興味があSARS-CoV-2感染させた。有無依存性 u l3m : l 3 種類の肺がんの培養目の培養細胞依存の応用に興味があbiological replicate 依存性 u l4i : l 4 種類の肺がんの培養目の培養細胞依存の応用に興味があ遺伝子依存性 G: 各項の重みの応用に興味があ重みみ 目の遺伝子の的を絞って説明し:培養細胞のバイオインフォ種類ラベルやヒストン修飾なbiological replicateに依らな い(u l1j やヒストン修飾なu l3m は遺伝子発現プロj,mに依らず一定値と呼ばれる)を)が、マルSARS-CoV-2 感じになって染の有無で変わるのバイオインフォ有り、条件無し学習にで変わる変数選択法とそ(u l21 =-u l22 )になる変数選択法とそようなl 1 ,l 2 ,l 3
  48. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 79 l 1 =1 l 2 =2 l

    3 =1 培養細胞に SARS-CoV-2 感染させた。有無 Biological replicate 培養細胞のバイオインフォ種類ラベルやヒストン修飾な biological replicateに依ら ないが、マルSARS-CoV-2感じになって 染の有無で変わるのバイオインフォ有り、条件無し学習にで変わる変数選択法とそ
  49. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 80 l 1 =1 l 2 =2 l

    3 =1 培養細胞のバイオインフォ種類ラベルやヒストン修飾なbiological replicateに依らないが、マルSARS-CoV- 2感じになって染の有無で変わるのバイオインフォ有り、条件無し学習にで変わる変数選択法とそような発現プロファイルをプロファイル分解を用いた教を用いた教師無し実現プロファイルをし学習にて遺伝子選択を行いる変数選択法とそ遺 伝子のバイオインフォ発現プロファイルをパターンは遺伝子発現プロu 5i (l 4 =5) の応用に興味があ時|G|が大きいきいl 4 は?
  50. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 81 u 5i がガウス分布していると分布しているというしている方は拙著をお買と思いますがよりいう帰無仮説の元に帰無仮説の元に、遺伝子の応用に興味があ元に、遺伝子に興味がある方は、遺伝子遺伝子iに興味がある方はχ二乗 分布しているというを仮定してしてP値を付与、多重比を付与、遺伝子多重み比較補正(ハードカバー)BH法)して0.01以下さい。 の応用に興味があ163 163遺伝子 遺伝子を選んだんだ

    ABCC3 ACE2 ACTB ACTG1 ACTN4 AHNAK AKAP12 AKR1B1 AKR1B10 AKR1C2 ALDH1A1 ALDH3A1 ALDOA AMIGO2 ANTXR1 ANXA2 ASNS ASPH ATF4 ATP1B1 C3 CALM2 CALR CD24 CFL1 CPLX2 CRIM1 CTGF CXCL5 CYP24A1 DCBLD2 DDIT4 DHCR24 EEF1A1 EEF2 EIF1 EIF4B EIF5A ENO1 ERBB2 EREG FADS2 FASN FDCSP FDPS FLNB FTH1 FTL G6PD GAPDH GAS5 GPX2 GSTP1 H1F0 HMGA1 HNRNPA2B1 HSP90AA1 HSP90AB1 HSPA8 ICAM1 IER3 IFIT2 IGFBP3 IGFBP4 ITGA2 ITGA3 ITGAV ITGB1 JUN KRT18 KRT19 KRT23 KRT5 KRT6A KRT7 KRT8 KRT81 LAMB3 LAMC2 LCN2 LDHA LIF LOXL2 MIEN1 MTHFD2 MYL6 NAMPT NAP1L1 NEAT1 NFKBIA NPM1 NQO1 OAS2 P4HB PABPC1 PFN1 PGK1 PKM PLAU PLOD2 PMEPA1 PPIA PPP1R15A PSAT1 PSMD3 PTMA RAI14 RNF213 RPL10 RPL12 RPL23 RPL26 RPL28 RPL3 RPL37 RPL4 RPL5 RPL7 RPL7A RPL9 RPS19 RPS20 RPS24 RPS27 RPS27A RPS3A RPS4X RPS6 S100A2 S100A6 SAT1 SCD SERPINA3 SERPINE1 SLC38A2 SLC7A11 SLC7A5 SPP1 SPTBN1 SQSTM1 STARD3 STAT1 STC2 TGFBI TGM2 TIPARP TMSB4X TNFAIP2 TOP2A TPI1 TPM1 TPT1 TRAM1 TUBA1B TUBB TUBB4B TXNIP TXNRD1 UBC VEGFA VIM YBX1 YWHAZ
  51. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 83 DESeq2 DESeq2 と思いますがよりの応用に興味があ比較 と思いますがよりの応用に興味があ比較 DESeq2 P>0.01 P≦0.01

    Calu3 7278 16432 NHBE 23383 327 A549 MOI 0.2 7858 15852 MOI 2.0 16279 7431 ACE2 expressed 16201 7509 論文を書いた後で、を書いた後で、原著いた後で、原著論文で、遺伝子原著をお買論文を書いた後で、[*] が刊行 (研究している時はしている方は拙著をお買時はGEO の応用に興味があデータセットしか公開されてされて いな奇特な人はいなかった). 論文を書いた後で、に興味がある方はは DESeq2 の応用に興味があ結果があるがある方は拙著をお買(Table S1, S2)。 limmaと思いますがより同じで大多数の遺じで大きい多数の遺伝子の応用に興味があ遺伝子 を発現差があると判定しがある方は拙著をお買と思いますがより判定してしてし まっている方は拙著をお買一方は拙著をお買(ハードカバー)MAQCの応用に興味があ結果がある と思いますがより同じで大多数の遺じ)、遺伝子 NHBE 培養細胞にでは 極端に少ない発現差に興味がある方は少ない発現差があな奇特な人はいない発現差があると判定しがある方は拙著をお買遺 伝子しか選んだべてな奇特な人はいない。 [*]Daniel Blanco-Melo et al, Cell, 2020; 181(5): 1036-1045.e9. doi: 10.1016/j.cell.2020.04.026. Imbalanced Host Response to SARS-CoV-2 Drives Development of COVID-19, Table S1,S2
  52. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 87 SARS-CoV-2 proteins P-values Odds Ratio SARS-CoV2 E

    2.34E-02 2.79E+00 SARS-CoV2 M 3.96E-02 2.26E+00 SARS-CoV2 N 1.74E-02 3.42E+00 SARS-CoV2 nsp1 1.87E-02 3.36E+00 SARS-CoV2 nsp10 1.75E-04 6.29E+00 SARS-CoV2 nsp11 2.69E-03 3.49E+00 SARS-CoV2 nsp12 5.61E-03 3.85E+00 SARS-CoV2 nsp13 4.60E-03 3.19E+00 SARS-CoV2 nsp14 1.26E-01 2.46E+00 SARS-CoV2 nsp15 6.59E-04 5.01E+00 SARS-CoV2 nsp2 2.98E-02 2.63E+00 SARS-CoV2 nsp4 3.60E-02 2.51E+00 SARS-CoV2 nsp5 1.32E-02 3.67E+00 SARS-CoV2 nsp5_C145A 1.48E-02 4.36E+00 SARS-CoV-2 proteins P-values Odds Ratio SARS-CoV2 nsp6 1.18E-01 1.96E+00 SARS-CoV2 nsp7 7.94E-03 3.17E+00 SARS-CoV2 nsp8 1.59E-02 2.76E+00 SARS-CoV2 nsp9 8.56E-03 3.51E+00 SARS-CoV2 orf10 1.82E-01 1.82E+00 SARS-CoV2 orf3a 1.06E-01 2.03E+00 SARS-CoV2 orf3b 1.25E-01 2.12E+00 SARS-CoV2 orf6 4.52E-01 1.54E+00 SARS-CoV2 orf7a 7.41E-01 1.22E+00 SARS-CoV2 orf8 2.29E-03 3.28E+00 SARS-CoV2 orf9b 1.16E-02 3.28E+00 SARS-CoV2 orf9c 4.24E-01 1.37E+00 SARS-CoV2 Spike 1.89E-02 2.93E+00 DESeq2, 補正P値と呼ばれる)を0.05以下で計測した。、マルLFC>2, 547genes, A549 MOI2.0 これがベスへの応用ト。だか無いので遺伝子ら上位ではなく、細胞を用いた教師無し選べば これがベスへの応用ト。だか無いので遺伝子ら上位ではなく、細胞を用いた教師無し選べば DESeq2 DESeq2でも適用可能でいい、マルとは遺伝子発現プロならない。 でも適用可能でいい、マルとは遺伝子発現プロならない。
  53. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 90 Term Overlap P-value Adjusted P-value Ivermectin-7.5 mg/kg

    in CMC-Rat-Liver-1d-dn 12/277 2.98E-06 9.93E-06 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-5d-dn 12/289 4.60E-06 1.44E-05 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-3d-dn 11/285 2.29E-05 5.56E-05 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-1d-up 10/323 3.28E-04 5.39E-04 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-5d-up 8/311 4.06E-03 5.10E-03 Ivermectin-7.5 mg/kg in CMC-Rat-Liver-3d-up 8/315 4.38E-03 5.46E-03 イベル分解を用いた教メクチンも適用可能でヒットし学習にて遺伝子選択を行お断り(その1)ります! DrugMatrix in Enrichr Enrichr
  54. 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 94 GSE142068:15種類ラベルのバイオインフォ化やヒストン修飾合物を用いた教師無しマウスへの応用に投与の臓器依存性のし学習にて遺伝子選択を行24種類の臓器の種類ラベルのバイオインフォ臓器のバイオインフォ 遺伝子発現プロファイルをを用いた教師無し全く部調べた(べた教師無し学習に(biological replicateは遺伝子発現プロ2) Satoshi Kozawa, Fumihiko Sagawa, Satsuki

    Endo, Glicia Maria De Almeida, Yuto Mitsuishi, Thomas N. Sato, “Predicting Human Clinical Outcomes Using Mouse Multi-Organ Transcriptome”, iScience, 2020,100791 15化やヒストン修飾合物 alendronate, acetaminophen, aripiprazole, asenapine, cisplatin, clozapine, doxycycline, empagliflozin, lenalidomide, lurasidone, olanzapine, volocumab [Repatha], risedronate, sofosbuvir, teriparatide 24臓器 AdrenalG, Aorta, BM (Bone marrow), Brain,Colon,Eye,Heart, Ileum, Jejunum,Kidney,Liver,Lung,Pancreas,ParotidG,PituitaryG, SkMuscle, Skin, Skull, Spleen, Stomach, Spleen, Thymus, ThyroidG, WAT(white adipose tissue)
  55. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 97 (1) Alendronate, (2) APAP, (3) Aripiprazole, (4)

    Asenapine, (5) Cisplatin, (6) Clozapine,(7) Dox, (8) EMPA, (9) FivePercentSucrose, (10) Lenalidomide, (11) Lurasidone, (12) Olanzapine, (13) Repatha, (14) Risedronate, (15) Sofosbuvir, (16) Teriparatide, (17)WT.No.treated, (18) 5%CMC,0.25%Tween80. ・2群が患者、に別が難しい。もっれる変数選択法とそ ・コントロール分解を用いた教 (+2薬剤とされたものが)vsそのバイオインフォ他 ・「そのバイオインフォ 他」という考えもあのバイオインフォ多様性の解析(青矢印)と「コ ントール分解を用いた教vsそのバイオインフォ他」という考えもあのバイオインフォ方向け(赤 矢印)は遺伝子発現プロ直交 ・「そのバイオインフォ他」という考えもあ薬剤とされたものが 群が患者、は遺伝子発現プロ効な指標。1か0果に共通性の解析がある変数選択法とそこと が期待される。される変数選択法とそ。・APAPと Sofosbuvirは遺伝子発現プロ効な指標。1か0果小さかったら「同(コント ロール分解を用いた教群が患者、と一緒なので)なのバイオインフォで) u 2k :化やヒストン修飾合物第二特異値と呼ばれる)をベクトル分解を用いた教 u 3k :化やヒストン修飾合物第三特異値と呼ばれる)をベクトル分解を用いた教
  56. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 102 Neuron特異的を絞って説明しに発現プロファイルをし学習にて遺伝子選択を行いる変数選択法とそ遺伝子=より小さなu 2i で値と呼ばれる)をが大きい遺伝子i P i =P χ2

    [ >( u 2i σ2 ) 2 ] u 2i が正規分布し学習にて遺伝子選択を行いる変数選択法とそことを用いた教師無し帰モデルでも誤差無し学習に仮説とし学習に、マル有り、条件意に大きな値と呼ばれる)をを用いた教師無し持っている。従っって遺伝子選択を行 いる変数選択法とそu 2i を用いた教師無し探す。サンプルはす。 →χ二乗分布を用いた教師無し仮定し学習にて遺伝子選択を行遺伝子iにP値と呼ばれる)をP i を用いた教師無し付き分布与の臓器依存性の →BH多重比較補正でP i <0.01になる変数選択法とそ遺伝子を用いた教師無し選ぶ。 → 18遺伝子が選択 →18遺伝子は遺伝子発現プロ化やヒストン修飾合物でコントロール分解を用いた教とそのバイオインフォ他で有り、条件意に発現プロファイルを差があるからといある変数選択法とそ? →YES(ウィル分解を用いた教コックスへの応用符号差があるからとい検定P=9.65×10-49) →18遺伝子は遺伝子発現プロ臓器でBrain+Eye+Pituitary+Testis vs Othersで発現プロファイルを差があるからとい ある変数選択法とそ? →YES(t検定P=2.14×10-24)
  57. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 104 ここまで出されてタンパク来たサンプルの数た教師無し学習にこと ・化やヒストン修飾合物のバイオインフォ投与の臓器依存性のに依って遺伝子選択を行どのバイオインフォような化やヒストン修飾合物が遺伝子発現プロファイルをプロファイ ル分解を用いた教のバイオインフォ変化やヒストン修飾を用いた教師無し共有り、条件し学習にて遺伝子選択を行いる変数選択法とそか無いので遺伝子? ・複数のバイオインフォ臓器のバイオインフォどのバイオインフォような組み合わせて機能み合わせで遺伝子発現プロファイルをプロファイル分解を用いた教 が変化やヒストン修飾し学習にて遺伝子選択を行いる変数選択法とそか無いので遺伝子? ・化やヒストン修飾合物のバイオインフォ組み合わせて機能み合わせ特異的を絞って説明し、マルか無いので遺伝子つ、マル臓器のバイオインフォ組み合わせて機能み合わせ特異的を絞って説明しに 発現プロファイルをが変化やヒストン修飾し学習にて遺伝子選択を行いる変数選択法とそ遺伝子のバイオインフォ特定

    こういうことは遺伝子発現プロ普通のバイオインフォ方法とそのバイオイでは遺伝子発現プロ難しいか?し学習にい。なぜなら.....、マル ・化やヒストン修飾合物のバイオインフォどのバイオインフォような組み合わせて機能み合わせを用いた教師無し考えればいいか無いので遺伝子解を用いた教師無らない ・臓器のバイオインフォどのバイオインフォような組み合わせて機能み合わせを用いた教師無し考えればいいか無いので遺伝子わか無いので遺伝子らない ・「化やヒストン修飾合物のバイオインフォ組み合わせて機能み合わせ特異的を絞って説明し」という考えもあか無いので遺伝子つ「臓器のバイオインフォ組み合わせて機能み合わせ特異的を絞って説明し」という考えもあ に同じ遺伝子を持っ時に発現プロファイルを差があるからといがある変数選択法とそ遺伝子を用いた教師無し探す。サンプルはす、マルというのバイオインフォは遺伝子発現プロ普通は遺伝子発現プロ難しいか?し学習にい ・Nが大きいのバイオインフォでP値と呼ばれる)をを用いた教師無し補正する変数選択法とそと有り、条件意差があるからといが消えがち
  58. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 122 N 変数 N 1 M 計測の解析にも適用 M/2

    M 計測の解析にも適用 ガウスへの応用分布 平均ゼロ ガウスへの応用分布 非ゼロ平均 M2 サンプル /1変数 i≦N 1 :は遺伝子発現プロj,k≦M/2 と othersのバイオインフォ間しか無いので遺に差があるからといがある変数選択法とそ i>N 1 : 差があるからといがない 問題: N 1 個のバイオインフォ2群が患者、で差があるからといがある変数選択法とそ変数を用いた教師無し選択 人が遺伝子発現プ工データ
  59. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 126 実データ(再掲:ドラッグリポジショニングで使って遺伝子選択った教師無し学習にのバイオインフォと同じ遺伝子を持っじ) x i jk m ∈ℝ21797×5×2×3 データセなのでは…。ット GSE147507

    3種類ラベルのバイオインフォ肺がんの培養細胞がんのバイオインフォ培養細胞にSARS-CoV-2を用いた教師無し感じになって染の有無で変わるさせた教師無し学習に。 i:遺伝子(21797) j: j=1:Calu3, j=2: NHBE, j=3:A549 MOI:0.2, j=4: A549 MOI 2.0, j=5:A549 ACE2 expressed (MOI:Multiplicity of infection) k: k=1: Mock, k=2:SARS-CoV-2 infected m: three biological replicates
  60. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 127 変数選択 変数選択 線形カーネル分解を用いた教: x jkj’k’ → u

    l1j , u l2k u l 1 i ∝∑ jk x ijk u l 1 j u l 2 k P i =P χ2 [> (u l 1 i σl 1 )2] P値と呼ばれる)をは遺伝子発現プロ Benjamini-Hochberg という多重比較補正で多重比較補正で補正で補正補正で補正 補正で補正 P-values <0.01 の遺伝子を選択遺伝子を選択を選択選択 TD
  61. 2022/1/17 統計物理と統計科学のセと統計科学のセミ統計科学のセミナーのセミナーセミナー 128 RBF, Polynomialカーネル分解を用いた教 ある変数選択法とそ遺伝子 i i を用いた教師無し除する。外れ値をうまく選 x

    jkj’k’ を用いた教師無し再計算して、もし、そ x jkj’k’ → u l1j ⨉ u l2k TD u l1j , u l2k と (k,j)のバイオインフォラベル分解を用いた教のバイオインフォ整合性の解析を用いた教師無し定量を2つ化やヒストン修飾 遺伝子 i i 整合性の解析のバイオインフォ「減った。少ない保証は全く順」という考えもあにランキング u l1j ⨉ u l2k k