Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Screening cell-cell communication in spatial tr...

Hide-Hishi
August 30, 2023

Screening cell-cell communication in spatial transcriptomics via collective optimal transport

Hide-Hishi

August 30, 2023
Tweet

Other Decks in Science

Transcript

  1. 最適輸送ってなに 『2つの確率分布を⽐較するツール』 などと表現されるがピンとこない 馴染みがなかったが 最適化理論で学ぶ線形計画法で登場 <⽬次> 第1章 数学的準備 第2章 関数の極値

    第3章 関数の最適化 … 勾配法,ニュートン法など 第4章 最⼩⼆乗法 第5章 統計的最適化 … 最尤推定, EMアルゴリズム 第6章 線形計画法 6.1 線形計画の標準形 6.2 可能領域 6.3 線形計画の基本定理 6.4 スラック変数 6.5 シンプレックス法 6.6 退化 6.7 ⼈⼯変数 6.8 双対原理 第7章 ⾮線形計画法 →SVMへ発展 ୈ8ষ ಈతܭը๏
  2. 最適輸送 例題1 ⼯場 X, ⼯場 Y がありそれぞれ製品を 100 個、 200

    個⽣産する. それらを町 1 に 75 個, 町 2 に 225 個輸送したい. 各⼯場から各町への 1 個あたりの輸送費⽤は 次の表のようにかかる. 輸送費⽤を最⼩にするには、どのように輸送すればよいか? 町1(75個) 町2(225個) ⼯場X(100個) 2円 6円 ⼯場Y(200個) 1円 4円 町1へ 町2へ ⼯場Xから 𝑥! 個 𝑥" 個 100個 ⼯場Yから 𝑦! 個 𝑦" 個 200個 75個 225個 𝐶 = 2 6 1 4 𝑋 = 𝑥! 𝑥" 𝑦! 𝑦"
  3. 最適輸送 例題2 𝑪 = 2 6 1 4 𝑿 =

    𝑥! 𝑥" 𝑦! 𝑦" 問題を読みかえると 𝒂 = 100 200 𝒃 = 75 225 𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 この問題はシンプルなので⾼校までの数学で解けてしまう。 𝑋 = 75 25 0 200 のとき輸送コストを最⼩化でき 1100円 min # ∈ ℝ!×! 4 &'! " 4 ('! " 𝑪&( 𝑿&( 𝑿&( ≥ 0 ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2 4 ('! " 𝑿&( = 𝒂& , 4 &'! " 𝑿&( = 𝒃( ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2
  4. 最適輸送 例題2 ヒストグラムA を改変してヒストグラムB を作るコストの最⼩値はいくらか A B コスト関数 𝐶 =

    0 2 2 2 2 0 1 2 2 1 0 2 2 2 2 0 猫と⻁は近そうなので低コスト 𝐴 = 0.2 0.5 0.2 0.1 , B = 0.3 0.3 0.4 0.0
  5. 最適輸送 例題2 𝐶 = 0 2 2 2 2 0

    1 2 2 1 0 2 2 2 2 0 𝐴 = 0.2 0.5 0.2 0.1 , B = 0.3 0.3 0.4 0.0 ヒストグラムA, Bは合計が1なので 分類モデルが出⼒した確率ベクトルと⾒ることもできる。 この時、確率分布A,Bの最適輸送コスト0.4を確率分布間がどの程度異なるかの指標とみなしてはどうか →実際コスト⾏列に特別な制約を課すことで距離の公理を満たすようになり、 厳密に最適輸送コストを分布間の距離とみなせる ex) Wasserstein 距離 適切なコスト関数Cを設定し⼀般化すれば, ⾏列A,Bの成分にあたるデータは カテゴリだけでなく, ベクトル, 画像データなどでもよい。 ⾏列AやBにあたる分布全体が連続関数でもよい。
  6. KLダイバージェンス 𝐾𝐿 𝛼 ∥ 𝛽 = . > 𝑝 𝑥

    𝑙𝑜𝑔 𝑝(𝑥) 𝑞(𝑥) 𝑑𝑥 = 𝔼?~A(?) 𝑙𝑜𝑔 𝑝(𝑥) 𝑞(𝑥) KLダイバージェンスは𝐾𝐿 𝛼 ∥ 𝛽 ≠ 𝐾𝐿 𝛽 ∥ 𝛼 のため厳密には距離ではない。 最尤推定はパラメータ(𝜃)を持つ分布𝑝) (𝑥)について、 サンプリングしたデータからなる経験分布 𝑝(𝑥)と𝑝) (𝑥)の KLダイバージェンスを最⼩にするパラメータ𝜃 を 推定していることが式変形で⽰せる。 2つの確率分布の差異を計る尺度 Qiita:⽣成モデルで語られる Kullback-Leibler を理解する https://qiita.com/TomokIshii/items/b9a11c19bd5c36ad0287
  7. 最適輸送 ⽤語定義 min # ∈ ℝ!×! 4 &'! " 4

    ('! " 𝑪&( 𝑿&( 𝑿&( ≥ 0 ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2 4 ('! " 𝑿&( = 𝒂& , 4 &'! " 𝑿&( = 𝒃( ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2 制約条件 実⾏可能解 … 制約条件を全て満たしている決定変数X 輸送多⾯体… 実⾏可能解の集合 線形計画の問題を標準形で定式化した時, 解空間が凸多⾯体となる … ⽬的関数
  8. 双対問題として損失関数の下界を求める 最後の⼆項は結合したリガンド・受容体と無駄になったものを合計すると シグナル発現量に⼀致することを制約 𝑓, 𝑔 … ラグランジュ乗数 𝑔! 𝑔" 𝑔*

    𝑓! 𝑓! + 𝑔! 𝑓! + 𝑔" 𝑓! + 𝑔* 𝑓" 𝑓" + 𝑔! 𝑓" + 𝑔" 𝑓" + 𝑔* 𝑓⨁𝑔 対数領域シンクホーン アルゴリズムの導出 制約条件を⽬的関数に組み⼊れる
  9. 双対問題 補⾜ 双対問題 … 最適化理論において主問題の最適解を得ることと対応する補問題 →要するに、「同じ問題を別の観点から」 強双対定理… 主問題が線形計画の時、主問題の最適値と双対問題の最適値が⼀致する 最適値(⽬的関数の最⼩値)が少なくともこれ以上だというような値を 簡単に⾒積もる⽅法はないか?

    ↓ 双対問題の最適値(⽬的関数の最⼤値)を求めればいい ↓ 線形計画なら、そのまま主問題の最適解が分かる おまけに、双対問題の⽅がコンピュータで最適化しやすい場合がある。 今回双対問題を求める理由はコレ →Sinkhorn アルゴリズム
  10. 双対問題・ラグランジュ緩和 補⾜ min +∈ℝ# 𝑓(𝑥) 𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 ℎ& 𝑥 ≤

    0 ∀𝑖 ∈ 1, … , 𝑛 ℎ& 𝑥 = 0 ∀𝑖 ∈ 𝑛 + 1, … , 𝑛 + 𝑚 以下を考える。制約条件を⽬的関数に統合したい。≤ 0, = 0 のような条件をどう扱うか 以下の関数を導⼊ ℒ,- 𝑥 ≝ X 0 𝑥 ≤ 0 ∞ 𝑥 > 0 ℒ- 𝑥 ≝ X 0 (𝑥 = 0) ∞ (𝑥 ≠ 0) min +∈ℝ# 𝑓(𝑥) + 4 &'! . ℒ,- ℎ& 𝑥 + 4 &'./! 0 ℒ- ℎ& 𝑥 事実上,制約条件に反すると⽬的関数が∞になるしくみ
  11. 双対問題・ラグランジュ緩和 補⾜ ℒ!" 𝑥 ≝ $ 0 𝑥 ≤ 0

    ∞ 𝑥 > 0 ℒ" 𝑥 ≝ $ 0 (𝑥 = 0) ∞ (𝑥 ≠ 0) min +∈ℝ# 𝑓(𝑥) + 4 &'! . ℒ,- ℎ& 𝑥 + 4 &'./! 0 ℒ- ℎ& 𝑥 主問題 𝑓∗ 𝑥 = 𝑓(𝑥) + 4 &'! . ℒ,- ℎ& 𝑥 + 4 &'./! 0 ℒ- ℎ& 𝑥 として min 𝑓∗ 𝑥 ≥ min 𝐿 ・ となる min 𝐿 ・ , ラグランジュ緩和問題を探す。 任意の𝜆 ≥ 0 について ℒ,- ℎ(𝑥) ≥ 𝜆ℎ 𝑥 ℒ- ℎ(𝑥) ≥ 𝜆ℎ(𝑥) より 𝐿 𝑥, 𝜆! , … , 𝜆./0 ≝ 𝑓 𝑥 + 4 &'! . 𝜆& ℎ& 𝑥 + 4 &'./! 0 𝜆& ℎ& 𝑥 コンピュータフリーク双対問題: 線形計画⼊⾨ 8より
  12. 双対問題・ラグランジュ緩和 補⾜ 𝐿 𝑥, 𝜆! , … , 𝜆./0 ≝

    𝑓 𝑥 + 4 &'! . 𝜆& ℎ& 𝑥 + 4 &'./! 0 𝜆& ℎ& 𝑥 𝑔 𝜆! , … , 𝜆./0 = min +∈ℝ# 𝐿 𝑥, 𝜆! , … , 𝜆./0 として,線形計画なので min +∈ℝ# 𝑓∗ 𝑥 = max 2 𝑔 𝜆! , … , 𝜆./0 双対問題
  13. Collective Optimal Transportに対応した対数領域シンクホーン アルゴリズムの導出 𝑔! 𝑔" 𝑔* 𝑓! 𝑓! +

    𝑔! 𝑓! + 𝑔" 𝑓! + 𝑔* 𝑓" 𝑓" + 𝑔! 𝑓" + 𝑔" 𝑓" + 𝑔* 𝑓⨁𝑔 制約条件を⽬的関数に組み⼊れる 双対問題として損失関数の下界を求める 最後の⼆項は結合したリガンド・受容体と無駄になったものを合計すると シグナル発現量に⼀致することを制約 𝑓, 𝑔 … ラグランジュ乗数
  14. 𝜕𝜖 𝜕𝜇& = 𝜖 log 𝜇& + 𝜌 − 𝑓&

    = 0 ⇒ 𝝁 = exp 𝒇 − 𝜌 𝜀 (7)∗ 𝑃&( より 𝐶&( ∗ 𝑃&( + 𝜖𝑃&( log 𝑃&( = 𝑓& ∗ 𝑃&( + 𝑔( ∗ 𝑃&( 𝑃, 𝐶 3 + 𝜖𝐻 𝑃 = 𝑓, 𝑃1. + 𝑔, 𝑃410 − 𝜖 𝑃, 10×. 3 𝜖𝐻 𝜇 + 𝜌 𝜇 ! = 𝑓, 𝜇 − 𝜖 𝜇, 10×. 𝜐も同様
  15. Comparison between mouse and human placenta http://katecholamine.org/portfolio/02_mouse_placenta/ Fig. 3 Inference

    of signaling direction in single-cell resolution spatial transcriptomics data.