Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

Screening cell-cell communication in spatial tr...

Avatar for Hide-Hishi Hide-Hishi
August 30, 2023

Screening cell-cell communication in spatial transcriptomics via collective optimal transport

Avatar for Hide-Hishi

Hide-Hishi

August 30, 2023
Tweet

Other Decks in Science

Transcript

  1. 最適茞送っおなに 『2぀の確率分垃を✐范するツヌル』 などず衚珟されるがピンずこない 銎染みがなかったが 最適化理論で孊ぶ線圢蚈画法で登堎 <✬次> 第1ç«  数孊的準備 第2ç«  関数の極倀

    第3ç«  関数の最適化 
 募配法,ニュヌトン法など 第4ç«  最〈⌆乗法 第5ç«  統蚈的最適化 
 最尀掚定, EMアルゎリズム 第6ç«  線圢蚈画法 6.1 線圢蚈画の暙準圢 6.2 可胜領域 6.3 線圢蚈画の基本定理 6.4 スラック倉数 6.5 シンプレックス法 6.6 退化 6.7 ⌈⌯倉数 6.8 双察原理 第7ç«  ⟮線圢蚈画法 →SVMぞ発展 ୈ8àŠ· ಈఀܭ՚๏
  2. 最適茞送 䟋題1 ⌯堎 X, ⌯堎 Y がありそれぞれ補品を 100 個、 200

    個✣産する. それらを町 1 に 75 個, 町 2 に 225 個茞送したい. 各⌯堎から各町ぞの 1 個あたりの茞送費✀は 次の衚のようにかかる. 茞送費✀を最〈にするには、どのように茞送すればよいか? 町1(75個) 町2(225個) ⌯堎X(100個) 2円 6円 ⌯堎Y(200個) 1円 4円 町1ぞ 町2ぞ ⌯堎Xから 𝑥! 個 𝑥" 個 100個 ⌯堎Yから 𝑊! 個 𝑊" 個 200個 75個 225個 𝐶 = 2 6 1 4 𝑋 = 𝑥! 𝑥" 𝑊! 𝑊"
  3. 最適茞送 䟋題2 𝑪 = 2 6 1 4 𝑿 =

    𝑥! 𝑥" 𝑊! 𝑊" 問題を読みかえるず 𝒂 = 100 200 𝒃 = 75 225 𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 この問題はシンプルなので⟌校たでの数孊で解けおしたう。 𝑋 = 75 25 0 200 のずき茞送コストを最〈化でき 1100円 min # ∈ ℝ!×! 4 &'! " 4 ('! " 𝑪&( 𝑿&( 𝑿&( ≥ 0 ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2 4 ('! " 𝑿&( = 𝒂& , 4 &'! " 𝑿&( = 𝒃( ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2
  4. 最適茞送 䟋題2 𝐶 = 0 2 2 2 2 0

    1 2 2 1 0 2 2 2 2 0 𝐎 = 0.2 0.5 0.2 0.1 , B = 0.3 0.3 0.4 0.0 ヒストグラムA, Bは合蚈が1なので 分類モデルが出⌒した確率ベクトルず⟒るこずもできる。 この時、確率分垃A,Bの最適茞送コスト0.4を確率分垃間がどの皋床異なるかの指暙ずみなしおはどうか →実際コスト⟏列に特別な制玄を課すこずで距離の公理を満たすようになり、 厳密に最適茞送コストを分垃間の距離ずみなせる ex) Wasserstein 距離 適切なコスト関数Cを蚭定し⌀般化すれば, ⟏列A,Bの成分にあたるデヌタは カテゎリだけでなく, ベクトル, 画像デヌタなどでもよい。 ⟏列AやBにあたる分垃党䜓が連続関数でもよい。
  5. KLダむバヌゞェンス 𝐟𝐿 𝛌 ∥ 𝛜 = . > 𝑝 𝑥

    𝑙𝑜𝑔 𝑝(𝑥) 𝑞(𝑥) 𝑑𝑥 = 𝔌?~A(?) 𝑙𝑜𝑔 𝑝(𝑥) 𝑞(𝑥) KLダむバヌゞェンスは𝐟𝐿 𝛌 ∥ 𝛜 ≠ 𝐟𝐿 𝛜 ∥ 𝛌 のため厳密には距離ではない。 最尀掚定はパラメヌタ(𝜃)を持぀分垃𝑝) (𝑥)に぀いお、 サンプリングしたデヌタからなる経隓分垃 𝑝(𝑥)ず𝑝) (𝑥)の KLダむバヌゞェンスを最〈にするパラメヌタ𝜃 を 掚定しおいるこずが匏倉圢で✰せる。 2぀の確率分垃の差異を蚈る尺床 Qiita:✣成モデルで語られる Kullback-Leibler を理解する https://qiita.com/TomokIshii/items/b9a11c19bd5c36ad0287
  6. 最適茞送 ✀語定矩 min # ∈ ℝ!×! 4 &'! " 4

    ('! " 𝑪&( 𝑿&( 𝑿&( ≥ 0 ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2 4 ('! " 𝑿&( = 𝒂& , 4 &'! " 𝑿&( = 𝒃( ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2 制玄条件 実⟏可胜解 
 制玄条件を党お満たしおいる決定倉数X 茞送倚⟯䜓  実⟏可胜解の集合 線圢蚈画の問題を暙準圢で定匏化した時, 解空間が凞倚⟯䜓ずなる 
 ✬的関数
  7. 双察問題ずしお損倱関数の䞋界を求める 最埌の⌆項は結合したリガンド・受容䜓ず無駄になったものを合蚈するず シグナル発珟量に⌀臎するこずを制玄 𝑓, 𝑔 
 ラグランゞュ乗数 𝑔! 𝑔" 𝑔*

    𝑓! 𝑓! + 𝑔! 𝑓! + 𝑔" 𝑓! + 𝑔* 𝑓" 𝑓" + 𝑔! 𝑓" + 𝑔" 𝑓" + 𝑔* 𝑓⚁𝑔 察数領域シンクホヌン アルゎリズムの導出 制玄条件を✬的関数に組み⌊れる
  8. 双察問題 補⟜ 双察問題 
 最適化理論においお䞻問題の最適解を埗るこずず察応する補問題 →芁するに、「同じ問題を別の芳点から」 匷双察定理  䞻問題が線圢蚈画の時、䞻問題の最適倀ず双察問題の最適倀が⌀臎する 最適倀(✬的関数の最〈倀)が少なくずもこれ以䞊だずいうような倀を 簡単に⟒積もる✅法はないか

    ↓ 双察問題の最適倀(✬的関数の最⌀倀)を求めればいい ↓ 線圢蚈画なら、そのたた䞻問題の最適解が分かる おたけに、双察問題の✅がコンピュヌタで最適化しやすい堎合がある。 今回双察問題を求める理由はコレ →Sinkhorn アルゎリズム
  9. 双察問題・ラグランゞュ緩和 補⟜ min +∈ℝ# 𝑓(𝑥) 𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 ℎ& 𝑥 ≀

    0 ∀𝑖 ∈ 1, 
 , 𝑛 ℎ& 𝑥 = 0 ∀𝑖 ∈ 𝑛 + 1, 
 , 𝑛 + 𝑚 以䞋を考える。制玄条件を✬的関数に統合したい。≀ 0, = 0 のような条件をどう扱うか 以䞋の関数を導⌊ ℒ,- 𝑥 ≝ X 0 𝑥 ≀ 0 ∞ 𝑥 > 0 ℒ- 𝑥 ≝ X 0 (𝑥 = 0) ∞ (𝑥 ≠ 0) min +∈ℝ# 𝑓(𝑥) + 4 &'! . ℒ,- ℎ& 𝑥 + 4 &'./! 0 ℒ- ℎ& 𝑥 事実䞊,制玄条件に反するず✬的関数が∞になるしくみ
  10. 双察問題・ラグランゞュ緩和 補⟜ ℒ!" 𝑥 ≝ $ 0 𝑥 ≀ 0

    ∞ 𝑥 > 0 ℒ" 𝑥 ≝ $ 0 (𝑥 = 0) ∞ (𝑥 ≠ 0) min +∈ℝ# 𝑓(𝑥) + 4 &'! . ℒ,- ℎ& 𝑥 + 4 &'./! 0 ℒ- ℎ& 𝑥 䞻問題 𝑓∗ 𝑥 = 𝑓(𝑥) + 4 &'! . ℒ,- ℎ& 𝑥 + 4 &'./! 0 ℒ- ℎ& 𝑥 ずしお min 𝑓∗ 𝑥 ≥ min 𝐿 ・ ずなる min 𝐿 ・ , ラグランゞュ緩和問題を探す。 任意の𝜆 ≥ 0 に぀いお ℒ,- ℎ(𝑥) ≥ 𝜆ℎ 𝑥 ℒ- ℎ(𝑥) ≥ 𝜆ℎ(𝑥) より 𝐿 𝑥, 𝜆! , 
 , 𝜆./0 ≝ 𝑓 𝑥 + 4 &'! . 𝜆& ℎ& 𝑥 + 4 &'./! 0 𝜆& ℎ& 𝑥 コンピュヌタフリヌク双察問題: 線圢蚈画⌊⟚ 8より
  11. 双察問題・ラグランゞュ緩和 補⟜ 𝐿 𝑥, 𝜆! , 
 , 𝜆./0 ≝

    𝑓 𝑥 + 4 &'! . 𝜆& ℎ& 𝑥 + 4 &'./! 0 𝜆& ℎ& 𝑥 𝑔 𝜆! , 
 , 𝜆./0 = min +∈ℝ# 𝐿 𝑥, 𝜆! , 
 , 𝜆./0 ずしお,線圢蚈画なので min +∈ℝ# 𝑓∗ 𝑥 = max 2 𝑔 𝜆! , 
 , 𝜆./0 双察問題
  12. Collective Optimal Transportに察応した察数領域シンクホヌン アルゎリズムの導出 𝑔! 𝑔" 𝑔* 𝑓! 𝑓! +

    𝑔! 𝑓! + 𝑔" 𝑓! + 𝑔* 𝑓" 𝑓" + 𝑔! 𝑓" + 𝑔" 𝑓" + 𝑔* 𝑓⚁𝑔 制玄条件を✬的関数に組み⌊れる 双察問題ずしお損倱関数の䞋界を求める 最埌の⌆項は結合したリガンド・受容䜓ず無駄になったものを合蚈するず シグナル発珟量に⌀臎するこずを制玄 𝑓, 𝑔 
 ラグランゞュ乗数
  13. 𝜕𝜖 𝜕𝜇& = 𝜖 log 𝜇& + 𝜌 − 𝑓&

    = 0 ⇒ 𝝁 = exp 𝒇 − 𝜌 𝜀 (7)∗ 𝑃&( より 𝐶&( ∗ 𝑃&( + 𝜖𝑃&( log 𝑃&( = 𝑓& ∗ 𝑃&( + 𝑔( ∗ 𝑃&( 𝑃, 𝐶 3 + 𝜖𝐻 𝑃 = 𝑓, 𝑃1. + 𝑔, 𝑃410 − 𝜖 𝑃, 10×. 3 𝜖𝐻 𝜇 + 𝜌 𝜇 ! = 𝑓, 𝜇 − 𝜖 𝜇, 10×. 𝜐も同様
  14. Comparison between mouse and human placenta http://katecholamine.org/portfolio/02_mouse_placenta/ Fig. 3 Inference

    of signaling direction in single-cell resolution spatial transcriptomics data.