Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Screening cell-cell communication in spatial transcriptomics via collective optimal transport

Hide-Hishi
August 30, 2023

Screening cell-cell communication in spatial transcriptomics via collective optimal transport

Hide-Hishi

August 30, 2023
Tweet

Other Decks in Science

Transcript

  1. 2023/2/10
    担当:
    九州⼤学 医学専攻博⼠課程2年
    菱沼 秀和

    View Slide

  2. COMMOTでできること
    Fig.5

    View Slide

  3. 塩浦昭義 先⽣ スライド
    http://www.iee.e.titech.ac.jp/~shioura/teaching/mp14/index.html
    今回 参考にした資料
    『最適輸送の理論とアルゴリズム』佐藤⻯⾺
    かなりの部分こちらの内容を引⽤しました
    <⾔い訳>
    厳密な理解にはルベーグ積分と測度論が必要らしいですが、
    表⾯的にしかなぞっていないので、質問に答えられない可能性があります。

    View Slide

  4. 最適輸送ってなに
    『2つの確率分布を⽐較するツール』
    などと表現されるがピンとこない
    馴染みがなかったが
    最適化理論で学ぶ線形計画法で登場
    <⽬次>
    第1章 数学的準備
    第2章 関数の極値
    第3章 関数の最適化
    … 勾配法,ニュートン法など
    第4章 最⼩⼆乗法
    第5章 統計的最適化
    … 最尤推定, EMアルゴリズム
    第6章 線形計画法
    6.1 線形計画の標準形
    6.2 可能領域
    6.3 線形計画の基本定理
    6.4 スラック変数
    6.5 シンプレックス法
    6.6 退化
    6.7 ⼈⼯変数
    6.8 双対原理
    第7章 ⾮線形計画法
    →SVMへ発展
    ୈ8ষ ಈతܭը๏

    View Slide

  5. 最適輸送 例題1
    ⼯場 X, ⼯場 Y がありそれぞれ製品を 100 個、 200 個⽣産する.
    それらを町 1 に 75 個, 町 2 に 225 個輸送したい.
    各⼯場から各町への 1 個あたりの輸送費⽤は 次の表のようにかかる.
    輸送費⽤を最⼩にするには、どのように輸送すればよいか?
    町1(75個) 町2(225個)
    ⼯場X(100個) 2円 6円
    ⼯場Y(200個) 1円 4円
    町1へ 町2へ
    ⼯場Xから 𝑥!
    個 𝑥"
    個 100個
    ⼯場Yから 𝑦!
    個 𝑦"
    個 200個
    75個 225個
    𝐶 =
    2 6
    1 4
    𝑋 =
    𝑥!
    𝑥"
    𝑦!
    𝑦"

    View Slide

  6. 最適輸送 例題2
    𝑪 =
    2 6
    1 4
    𝑿 =
    𝑥!
    𝑥"
    𝑦!
    𝑦"
    問題を読みかえると
    𝒂 =
    100
    200
    𝒃 =
    75
    225
    𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜
    この問題はシンプルなので⾼校までの数学で解けてしまう。
    𝑋 =
    75 25
    0 200
    のとき輸送コストを最⼩化でき 1100円
    min
    # ∈ ℝ!×!
    4
    &'!
    "
    4
    ('!
    "
    𝑪&(
    𝑿&(
    𝑿&(
    ≥ 0 ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2
    4
    ('!
    "
    𝑿&(
    = 𝒂&
    , 4
    &'!
    "
    𝑿&(
    = 𝒃(
    ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2

    View Slide

  7. 最適輸送 例題2
    ヒストグラムA を改変してヒストグラムB を作るコストの最⼩値はいくらか
    A B
    コスト関数
    𝐶 =
    0 2 2 2
    2 0 1 2
    2 1 0 2
    2 2 2 0
    猫と⻁は近そうなので低コスト
    𝐴 =
    0.2
    0.5
    0.2
    0.1
    , B =
    0.3
    0.3
    0.4
    0.0

    View Slide

  8. 最適輸送 例題2
    ヒストグラムA を改変してヒストグラムB を作るコストの最⼩値はいくらか
    A B
    答え
    𝑃 =
    0.2 0 0 0
    0 0.3 0.2 0
    0 0 0.2 0
    0.1 0 0 0 の時, コストは0.4で最⼩

    View Slide

  9. 最適輸送 例題2
    𝐶 =
    0 2 2 2
    2 0 1 2
    2 1 0 2
    2 2 2 0
    𝐴 =
    0.2
    0.5
    0.2
    0.1
    , B =
    0.3
    0.3
    0.4
    0.0
    ヒストグラムA, Bは合計が1なので 分類モデルが出⼒した確率ベクトルと⾒ることもできる。
    この時、確率分布A,Bの最適輸送コスト0.4を確率分布間がどの程度異なるかの指標とみなしてはどうか
    →実際コスト⾏列に特別な制約を課すことで距離の公理を満たすようになり、
    厳密に最適輸送コストを分布間の距離とみなせる ex) Wasserstein 距離
    適切なコスト関数Cを設定し⼀般化すれば, ⾏列A,Bの成分にあたるデータは
    カテゴリだけでなく, ベクトル, 画像データなどでもよい。
    ⾏列AやBにあたる分布全体が連続関数でもよい。

    View Slide

  10. KLダイバージェンス
    𝐾𝐿 𝛼 ∥ 𝛽 = .
    >
    𝑝 𝑥 𝑙𝑜𝑔
    𝑝(𝑥)
    𝑞(𝑥)
    𝑑𝑥 = 𝔼?~A(?) 𝑙𝑜𝑔
    𝑝(𝑥)
    𝑞(𝑥)
    KLダイバージェンスは𝐾𝐿 𝛼 ∥ 𝛽 ≠ 𝐾𝐿 𝛽 ∥ 𝛼 のため厳密には距離ではない。
    最尤推定はパラメータ(𝜃)を持つ分布𝑝)
    (𝑥)について、
    サンプリングしたデータからなる経験分布 𝑝(𝑥)と𝑝)
    (𝑥)の
    KLダイバージェンスを最⼩にするパラメータ𝜃 を
    推定していることが式変形で⽰せる。
    2つの確率分布の差異を計る尺度
    Qiita:⽣成モデルで語られる Kullback-Leibler を理解する
    https://qiita.com/TomokIshii/items/b9a11c19bd5c36ad0287

    View Slide

  11. 佐藤⻯⾺ IBIS2021スライドよりhttps://ibisml.org/ibis2021/
    KLダイバージェンスと最適輸送コストの⽐較
    例) 気温のヒストグラム
    KLダイバージェンスでは ⻘↔⾚の距離と⻘↔緑の距離は同じ
    最適輸送では ⻘↔緑の⽅が⼤きく、分布の⽐較において距離構造を反映可能

    View Slide

  12. 最適輸送 ⽤語定義
    min
    # ∈ ℝ!×!
    4
    &'!
    "
    4
    ('!
    "
    𝑪&(
    𝑿&(
    𝑿&(
    ≥ 0 ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2
    4
    ('!
    "
    𝑿&(
    = 𝒂&
    , 4
    &'!
    "
    𝑿&(
    = 𝒃(
    ∀𝑖 ∈ 2 , ∀𝑗 ∈ 2
    制約条件
    実⾏可能解 … 制約条件を全て満たしている決定変数X
    輸送多⾯体… 実⾏可能解の集合
    線形計画の問題を標準形で定式化した時, 解空間が凸多⾯体となる
    … ⽬的関数

    View Slide

  13. 要旨
    ・空間トランスクリプトームデータをもとにリガンドと受容体を介した細胞間相互作⽤の
    推定を⾏うツール, COMMOTを提案
    ・複数のリガンド・受容体の競合と空間的制約を適切に組み込み最適化するために、
    改良した最適輸送アルゴリズムを導⼊
    ・重要な細胞間相互作⽤に対して厳密な解析を⾏うためのスクリーニングとしてCOMMOTは有効であ
    る。
    また、解析結果をCOMMOTのパラメータに反映することでより精度を⾼められる
    ・PDEモデルによるシミュレーションデータと⽐較して予測の妥当性を検証
    ・既存の空間データを⽤いてCOMMOTの有効性を確認

    View Slide

  14. View Slide

  15. COMMOTでできること
    下流の解析についてきちんと説明できない

    View Slide

  16. 最適化する⽬的関数
    𝑷
    イメージ
    ・リガンドと受容体のなるべく
    近い組み合わせを探す
    ・スポットごとの発現量と⼀致する

    View Slide

  17. 効率的なアルゴリズムを適⽤するための定式化
    ・正則化エントロピー Hについて
    ・εは実際には計算効率化のために全て同じ値をとる
    ⽬的:
    ・強凸性による効率的な最適化アルゴリズムの実装
    ・⾮負制約の表現
    佐藤⻯⾺ IBIS2021スライドよりhttps://ibisml.org/ibis2021/

    View Slide

  18. 双対問題として損失関数の下界を求める
    最後の⼆項は結合したリガンド・受容体と無駄になったものを合計すると
    シグナル発現量に⼀致することを制約
    𝑓, 𝑔 … ラグランジュ乗数
    𝑔!
    𝑔"
    𝑔*
    𝑓!
    𝑓!
    + 𝑔!
    𝑓!
    + 𝑔"
    𝑓!
    + 𝑔*
    𝑓"
    𝑓"
    + 𝑔!
    𝑓"
    + 𝑔"
    𝑓"
    + 𝑔*
    𝑓⨁𝑔
    対数領域シンクホーン アルゴリズムの導出
    制約条件を⽬的関数に組み⼊れる

    View Slide

  19. 双対問題
    補⾜
    双対問題 … 最適化理論において主問題の最適解を得ることと対応する補問題
    →要するに、「同じ問題を別の観点から」
    強双対定理… 主問題が線形計画の時、主問題の最適値と双対問題の最適値が⼀致する
    最適値(⽬的関数の最⼩値)が少なくともこれ以上だというような値を
    簡単に⾒積もる⽅法はないか?

    双対問題の最適値(⽬的関数の最⼤値)を求めればいい

    線形計画なら、そのまま主問題の最適解が分かる
    おまけに、双対問題の⽅がコンピュータで最適化しやすい場合がある。
    今回双対問題を求める理由はコレ
    →Sinkhorn アルゴリズム

    View Slide

  20. 双対問題・ラグランジュ緩和
    補⾜
    min
    +∈ℝ#
    𝑓(𝑥)
    𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 ℎ&
    𝑥 ≤ 0 ∀𝑖 ∈ 1, … , 𝑛
    ℎ&
    𝑥 = 0 ∀𝑖 ∈ 𝑛 + 1, … , 𝑛 + 𝑚
    以下を考える。制約条件を⽬的関数に統合したい。≤ 0, = 0 のような条件をどう扱うか
    以下の関数を導⼊
    ℒ,-
    𝑥 ≝ X
    0 𝑥 ≤ 0
    ∞ 𝑥 > 0
    ℒ-
    𝑥 ≝ X
    0 (𝑥 = 0)
    ∞ (𝑥 ≠ 0)
    min
    +∈ℝ#
    𝑓(𝑥) + 4
    &'!
    .
    ℒ,-
    ℎ&
    𝑥 + 4
    &'./!
    0
    ℒ-
    ℎ&
    𝑥
    事実上,制約条件に反すると⽬的関数が∞になるしくみ

    View Slide

  21. 双対問題・ラグランジュ緩和
    補⾜
    ℒ!"
    𝑥 ≝ $
    0 𝑥 ≤ 0
    ∞ 𝑥 > 0
    ℒ"
    𝑥 ≝ $
    0 (𝑥 = 0)
    ∞ (𝑥 ≠ 0)
    min
    +∈ℝ#
    𝑓(𝑥) + 4
    &'!
    .
    ℒ,-
    ℎ&
    𝑥 + 4
    &'./!
    0
    ℒ-
    ℎ&
    𝑥
    主問題
    𝑓∗ 𝑥 = 𝑓(𝑥) + 4
    &'!
    .
    ℒ,-
    ℎ&
    𝑥 + 4
    &'./!
    0
    ℒ-
    ℎ&
    𝑥
    として
    min 𝑓∗ 𝑥 ≥ min 𝐿 ・
    となる min 𝐿 ・ , ラグランジュ緩和問題を探す。
    任意の𝜆 ≥ 0 について
    ℒ,-
    ℎ(𝑥) ≥ 𝜆ℎ 𝑥
    ℒ-
    ℎ(𝑥) ≥ 𝜆ℎ(𝑥) より
    𝐿 𝑥, 𝜆!
    , … , 𝜆./0
    ≝ 𝑓 𝑥 + 4
    &'!
    .
    𝜆&
    ℎ&
    𝑥 + 4
    &'./!
    0
    𝜆&
    ℎ&
    𝑥
    コンピュータフリーク双対問題: 線形計画⼊⾨ 8より

    View Slide

  22. 双対問題・ラグランジュ緩和
    補⾜
    𝐿 𝑥, 𝜆!
    , … , 𝜆./0
    ≝ 𝑓 𝑥 + 4
    &'!
    .
    𝜆&
    ℎ&
    𝑥 + 4
    &'./!
    0
    𝜆&
    ℎ&
    𝑥
    𝑔 𝜆!
    , … , 𝜆./0
    = min
    +∈ℝ#
    𝐿 𝑥, 𝜆!
    , … , 𝜆./0
    として,線形計画なので
    min
    +∈ℝ#
    𝑓∗ 𝑥 = max
    2
    𝑔 𝜆!
    , … , 𝜆./0
    双対問題

    View Slide

  23. Collective Optimal Transport の提案
    古典的な最適輸送
    ・各分⼦の発現量が等しくなるように正規化される
    不均衡最適輸送
    ・最適化⼿法の制約により,発現量の収⽀に致命的な⽭盾が⽣じうる
    部分最適輸送
    ・推定困難な追加パラメータが必要になる
    Collective Optimal Transport
    リガンドと受容体の競合を考慮しつつ,上記問題を回避した定式化

    View Slide

  24. Collective Optimal Transportに対応した対数領域シンクホーン アルゴリズムの導出
    𝑔!
    𝑔"
    𝑔*
    𝑓!
    𝑓!
    + 𝑔!
    𝑓!
    + 𝑔"
    𝑓!
    + 𝑔*
    𝑓"
    𝑓"
    + 𝑔!
    𝑓"
    + 𝑔"
    𝑓"
    + 𝑔*
    𝑓⨁𝑔
    制約条件を⽬的関数に組み⼊れる
    双対問題として損失関数の下界を求める
    最後の⼆項は結合したリガンド・受容体と無駄になったものを合計すると
    シグナル発現量に⼀致することを制約
    𝑓, 𝑔 … ラグランジュ乗数

    View Slide

  25. 𝜕𝜖
    𝜕𝜇&
    = 𝜖 log 𝜇&
    + 𝜌 − 𝑓&
    = 0 ⇒ 𝝁 = exp
    𝒇 − 𝜌
    𝜀
    (7)∗ 𝑃&(
    より
    𝐶&(
    ∗ 𝑃&(
    + 𝜖𝑃&(
    log 𝑃&(
    = 𝑓&
    ∗ 𝑃&(
    + 𝑔(
    ∗ 𝑃&(
    𝑃, 𝐶 3
    + 𝜖𝐻 𝑃 = 𝑓, 𝑃1. + 𝑔, 𝑃410 − 𝜖 𝑃, 10×.
    3
    𝜖𝐻 𝜇 + 𝜌 𝜇 !
    = 𝑓, 𝜇 − 𝜖 𝜇, 10×.
    𝜐も同様

    View Slide

  26. (9)について𝒇は𝒈が決定されている時, 成分ごとに独⽴で勾配計算ができる。𝒈についても同様
    𝐿を最⼤化するために𝑓, 𝑔の⼀⽅を固定し他⽅を決定する時、(9)が0として対数をとると
    簡単のため として、𝑓ないし𝑔は

    View Slide

  27. 最適化計算の安定化のため以下のように書き換える
    任意の値 𝑓(-), 𝑔(-)からパラメータの更新を⾏う

    View Slide

  28. Ext Data Fig.1
    COMMOTによるCCC推定とPDEモデルの⽐較
    CCC : cell-cell communications
    PDEの特定のパラメータ(拡散係数など)にしかfitしていない気がするが…

    View Slide

  29. Fig. 2 Role of CCC in human skin development

    View Slide

  30. 主要なシグナル経路の⽅向と影響を受ける下流遺伝⼦の予測
    Fig. 2 Role of CCC in human skin development

    View Slide

  31. Fig. 3 Inference of signaling direction in single-cell resolution spatial transcriptomics data.

    View Slide

  32. Comparison between mouse and human placenta
    http://katecholamine.org/portfolio/02_mouse_placenta/
    Fig. 3 Inference of signaling direction in single-cell resolution spatial transcriptomics data.

    View Slide

  33. Fig. 3 Inference of signaling direction in single-cell resolution spatial transcriptomics data.

    View Slide

  34. ANNEXIN, Angiopoietinは⽅向性の似た領域で活性化している
    Fig. 3 Inference of signaling direction in single-cell resolution spatial transcriptomics data.

    View Slide

  35. Fig.4 Downstream analysis of inferred CCC in single-cell resolution spatial transcriptomics data

    View Slide

  36. Fig.4 Downstream analysis of inferred CCC in single-cell resolution spatial transcriptomics data

    View Slide

  37. Fig.5 CCC inference using Visium spatial transcriptomics data.

    View Slide

  38. Fig.5 CCC inference using Visium spatial transcriptomics data.

    View Slide

  39. Fig.5 CCC inference using Visium spatial transcriptomics data.

    View Slide

  40. まとめ
    ・空間トランスクリプトームデータをもとにリガンドと受容体を介した細胞間相互作⽤の
    推定を⾏うツール, COMMOTを提案
    ・複数のリガンド・受容体の競合と空間的制約を適切に組み込み最適化するために、
    改良した最適輸送アルゴリズムを導⼊
    ・重要な細胞間相互作⽤に対して厳密な解析を⾏うためのスクリーニングとしてCOMMOTは有効である。
    また、解析結果をCOMMOTのパラメータに反映することでより精度を⾼められる
    ・PDEモデルによるシミュレーションデータと⽐較して予測の妥当性を検証
    ・既存の空間データを⽤いてCOMMOTの有効性を確認

    View Slide