Slide 1

Slide 1 text

バイオインフォマティクスにおける 数理最適化の応用 京都大学化学研究所 バイオインフォマティクスセンター 田村 武幸 2024年11月18日 RAMP 2024

Slide 2

Slide 2 text

生命情報学の基本 (DNA、RNA、タンパク質) ◼ セントラルドグマ ◼ DNAに記述された遺伝情報 ◼ mRNAに転写 ◼ タンパク質に翻訳され生体内で機能 ◼ ヒトには約3万の遺伝子 ◼ 状況に応じて働く遺伝子が変わる ◼ 細胞の種類、細胞周期、1日のリズム、環境の変化 ◼ 遺伝子どうしで互いに複雑に制御 ◼ 生成されるタンパク質やmRNAの量 = 対応する遺伝 子の発現量、と考えることができる。 ◼ では、タンパク質は具体的にどのように働くのか?

Slide 3

Slide 3 text

代謝ネットワークとは(1) ◼ 細胞内には様々な化合物が存在し、互いに化学反 応を繰り返すことにより生命活動が維持される。 ◼ これらの化合物と反応の関係は代謝ネットワークに より表現される。 ◼ この時、反応の触媒として機能するのが、遺伝子か ら作られた酵素と呼ばれるタンパク質である

Slide 4

Slide 4 text

経済財政運営と改革の基本方針 2022 (骨太の方針) - 社会課題を経済成長のエンジンへと押し上げていくため には、科学技術・イノベーションの力が不可欠である。 - 特に、量子、AI、バイオものづくり、再生・細胞医療・遺伝 子治療等のバイオテクノロジー・医療分野は我が国の国 益に直結する科学技術分野である。 - このため、国が国家戦略を明示し、官民が連携して科学 技術投資の抜本拡充を図り、科学技術立国を再興する。 骨太の方針2022: バイオものづくり

Slide 5

Slide 5 text

バイオものづくりとは 情報科学技術による生物機能デザイン + ゲノム編集技術による改変細胞(スマートセル) → ものづくりにおける第五次産業革命 - 環境問題の観点からもバイオ合成の方法論の確立が重要 - 微生物の代謝ネットワーク改変による有用物質生産

Slide 6

Slide 6 text

代謝ネットワークのデータベース ◼ KEGG: Kyoto Encyclopedia of Genes and Genomes ◼ http://www.genome.jp/ kegg/ ◼ 代謝ネットワークや医 薬品など、生命科学全 般のデータベース (左図はKEGGから引用) ブドウ糖 クエン酸回路 でエネルギーを得る

Slide 7

Slide 7 text

◼ ヒトがパンや米などを 食べると、デンプンが 分解されグルコース(ブ ドウ糖)となり、小腸か ら吸収される。 ◼ 酸素を用いてクエン酸 回路で、効率よくエネ ルギーを得る ◼ 生物種により、用いら れる経路が異なる。 ブドウ糖 クエン酸回路 でエネルギーを得る 代謝ネットワークのデータベース

Slide 8

Slide 8 text

◼ 代謝経路の例 ◼ 解糖系:糖を分解してピルビン酸などを生成 ◼ TCA回路(クエン酸回路):ピルビン酸などからア セチルCoAを経由して、ATPやNADHを生成 ◼ 脂肪酸合成経路: 余ったアセチルCoAを脂肪酸 にして蓄える ◼ 脂肪酸分解経路:エネルギー欠乏時に脂肪酸を 分解して、アセチルCoAを得る ◼ カルビン回路:光合成により糖を生成 ◼ 多くの代謝反応は酵素(≒タンパク質)により 触媒される 代謝ネットワークとは(2)

Slide 9

Slide 9 text

D-グルコース ピルビン酸 (化合物の図はKEGG から引用) ◼ 例えば、米やパンを食べる と、小腸から吸収されたブ ドウ糖(グルコース)は、 様々な酵素(遺伝子情報を 基にしたタンパク質)に触 媒されて複数の化学反応 を経て、ピルビン酸まで分 解される ◼ その後、 ◼ クエン酸回路に送られエネ ルギー(ATP)を得る ◼ 脂肪酸にして貯蓄 ◼ 還元されて乳酸になる ◼ 発酵してアルコールになる (微生物などの場合) 代謝ネットワークとは(3)

Slide 10

Slide 10 text

ピルビン酸周辺の代謝経路(KEGGから引用) ピルビン酸 乳酸 エタノール 酢酸 クエン酸 回路 アセチル CoA 解糖系 グルコースより分解 糖新生 アセトアルデヒド (二日酔いの原因と言われている) アセトアルデヒド 脱水素酵素

Slide 11

Slide 11 text

ヒトのアセトアルデヒド脱水素酵素(ALDH) - DNA配列の長さは1554 atgttgcgcgctgccgcccgcttcgggccccgcctgggccgccgcctcttgtcagccgccgccacccaggccgtgc ctgcccccaaccagcagcccgaggtcttctgcaaccagattttcataaacaatgaatggcacgatgccgtcagcag gaaaacattccccaccgtcaatccgtccactggagaggtcatctgtcaggtagctgaaggggacaaggaagatgt ggacaaggcagtgaaggccgcccgggccgccttccagctgggctcaccttggcgccgcatggacgcatcacaca ggggccggctgctgaaccgcctggccgatctgatcgagcgggaccggacctacctggcggccttggagaccctg gacaatggcaagccctatgtcatctcctacctggtggatttggacatggtcctcaaatgtctccggtattatgccggct gggctgataagtaccacgggaaaaccatccccattgacggagacttcttcagctacacacgccatgaacctgtgg gggtgtgcgggcagatcattccgtggaatttcccgctcctgatgcaagcatggaagctgggcccagccttggcaac tggaaacgtggttgtgatgaaggtagctgagcagacacccctcaccgccctctatgtggccaacctgatcaagga ggctggctttccccctggtgtggtcaacattgtgcctggatttggccccacggctggggccgccattgcctcccatga ggatgtggacaaagtggcattcacaggctccactgagattggccgcgtaatccaggttgctgctgggagcagcaa cctcaagagagtgaccttggagctgggggggaagagccccaacatcatcatgtcagatgccgatatggattggg ccgtggaacaggcccacttcgccctgttcttcaaccagggccagtgctgctgtgccggctcccggaccttcgtgcag gaggacatctatgatgagtttgtggagcggagcgttgcccgggccaagtctcgggtggtcgggaacccctttgata gcaagaccgagcaggggccgcaggtggatgaaactcagtttaagaagatcctcggctacatcaacacggggaa gcaagagggggcgaagctgctgtgtggtgggggcattgctgctgaccgtggttacttcatccagcccactgtgttt ggagatgtgcaggatggcatgaccatcgccaaggaggagatcttcgggccagtgatgcagatcctgaagttcaa gaccatagaggaggttgttgggagagccaacaattccacgtacgggctggccgcagctgtcttcacaaaggattt ggacaaggccaattacctgtcccaggccctccaggcgggcactgtgtgggtcaactgctatgatgtgtttggagcc cagtcaccctttggtggctacaagatgtcggggagtggccgggagttgggcgagtacgggctgcaggcatacact gaagtgaaaactgtcacagtcaaagtgcctcagaagaactcataa

Slide 12

Slide 12 text

ヒトのアセトアルデヒド脱水素酵素(ALDH) - 酵素(タンパク質)のアミノ酸配列の長さは517 - 487番目がE(グルタミン酸)だとアセトアルデヒドの 分解力が強く、K(リジン)だと弱いと言われている。 - EE強い、EKやや弱い、KK弱い MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSR KTFPTVNPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASHRG RLLNRLADLIERDRTYLAALETLDNGKPYVISYLVDLDMVLKCLRYYAGWADK YHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVV MKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAGAAIASHEDVDKVAF TGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMSDADMDWAVEQAHFALF FNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGNPFDSKTEQGPQVD ETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKE EIFGPVMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTV WVNCYDVFGAQSPFGGYKMSGSGRELGEYGLQAYTEVKTVTVKVPQKN

Slide 13

Slide 13 text

2020年 ノーベル化学賞 - ゲノム編集、CRISPR-Cas9 (クリスパー・キャス・ナイン) - Emmanuelle Charpentier, Jennifer Anne Doudna - DNA二本鎖を切断してゲノム配列の任意の場所を 削除、置換、挿入することができる新しい遺伝子 改変技術。 写真はNHKホームページ より引用

Slide 14

Slide 14 text

代謝ネットワークの数理モデル - 生物学ではしばしば、再現性のある数理モデルの構築を 研究の最終目標とする場合がある。 - 一方で、完璧な再現性のある数理モデルの構築は実質的 に不可能。All models are wrong, but some models are useful. 目的に応じて使い分ける必要がある。 - 微分方程式モデル: 各化合物の濃度の経時変化を再現。手持ちのデータを 用いて、再現性の高い、小規模数理モデルの構築に特 に有効 - 制約モデル(ゲノムスケール代謝モデル) 代謝の定常状態(各化合物の濃度は一定)を仮定。 線形計画問題に定式化されるため大規模モデルでも 高速なシミュレーションが可能。

Slide 15

Slide 15 text

代謝の制約モデル(ゲノムスケールモデル)の例 iAF1260: 大腸菌 1260遺伝子 2077反応 1668化合物 iJO1366: 大腸菌 1366遺伝子 2583反応 1805化合物 iML1515: 大腸菌 1515遺伝子 2712反応 1877化合物 iMM904: 出芽酵母 904遺伝子 1577反応 1228化合物 RECON1: ヒト 1905遺伝子 3741反応 2766化合物 など。BiGG Models データベースより http://bigg.ucsd.edu/models

Slide 16

Slide 16 text

制約モデルを用いたフラックス・バランス解析 (Flux balance analysis: FBA) - 代謝の定常状態を仮定する数理モデル - 四角は化学反応で、丸は化合物。 - 黒い四角は外部とのやりとりがある交換反応、白い四角は 内部反応。 細胞増殖率

Slide 17

Slide 17 text

- 内部化合物に流入するフローの総和と流出するフローの総 和は等しい。 - 各反応では、化学反応式における比率をみたす。 - 各細胞は自身の増殖率を最大化するという仮定に基づき、 細胞増殖率が最大化される。 (継代培養で細胞増殖の大きな遺伝型が残る) Flux balance analysis (FBA) 細胞増殖率

Slide 18

Slide 18 text

FBAの線形計画問題による定式化の例 細胞増殖率

Slide 19

Slide 19 text

FBAの線形計画問題による定式化の例 10 5 5 5 10 増殖率最大 細胞増殖率

Slide 20

Slide 20 text

FBAの線形計画問題による定式化の例 10 5 5 5 5 5 増殖率最大ではない 細胞増殖率

Slide 21

Slide 21 text

遺伝子による反応の制御: GPRネットワーク ∧: AND関数。タンパク質の複合体等を想定 ∨: OR関数。アイソザイム等の他遺伝子による補完を想定。 例えば反応4は g1∧g3 で制御されるので、遺伝子1と遺伝子3 のどちらかが欠失すると、反応4はおこらなくなる。

Slide 22

Slide 22 text

増殖連動生産 (growth-coupled production) 10 5 5 5 5 5 細胞増殖率 - バイオものづくりのキーとなる考え方 - 目的物質生産が細胞増殖の副作用となっている状態 増殖すればするほど、目的物質生産される - 微生物自体は、自らの成長や増殖が最大の関心事であり、 生成能力があっても、我々が欲しい目的物質を生産して くれない場合がほとんど。

Slide 23

Slide 23 text

本研究における問題設定 INPUT: 代謝ネットワークの制約モデル、目的化合物 OUTPUT: 細胞増殖率最大化時に(最悪ケースでも) 目的物質が生産される遺伝子削除戦略 ただし、細胞増殖率と目的物質生産量は 指定された最低値を超える必要がある。

Slide 24

Slide 24 text

どの遺伝子を削除すれば、増殖連動生産になるか? 上図では、栄養源がすべて細胞増殖に使われてしまい、 目的物質が生産されない。

Slide 25

Slide 25 text

どの遺伝子を削除すれば、増殖連動生産になるか? 増殖連動生産が達成されている例。 ゲノムスケールの代謝ネットワークに対する遺伝子削除 戦略の計算はとても難しい。(既存手法ではほとんどできない)

Slide 26

Slide 26 text

増殖連動生産のコア部分を最初に計算する (TrimGdelのステップ1) コア部分を抽出するために、できるだけ多くの反応が使用 不能になる遺伝子削除戦略を計算する。 g1, g3, g4, g5 の削除 → (r2, r4, r5 が使用不能) → 上記のコア部分を得られる。→ しかし遺伝子削除数が多すぎる。 T. Tamura, Trimming gene deletion strategies for growth-coupled production in constraint-based metabolic networks: TrimGdel, IEEE/ACM Transactions on Computational Biology and Bioinformatics, 20(2):1540-1549,

Slide 27

Slide 27 text

次にコア部分の代謝フローを保持しつつ削除を減らす (TrimGdelのステップ2) g1, g3, g4, g5 の削除 → 増殖率=5, 生産率=5 (r2, r4, r5 が使用不能) g5の削除を取りやめても使用可能な反応セットは変わらない g1, g3, g4 の削除 → 増殖率=5, 生産率=5 T. Tamura, Trimming gene deletion strategies for growth-coupled production in constraint-based metabolic networks: TrimGdel, IEEE/ACM Transactions on Computational Biology and Bioinformatics, 20(2):1540-1549,

Slide 28

Slide 28 text

当初の増殖率と生産率を保証しつつ削除を減らす (TrimGdelのステップ3) g1, g3, g4 の削除 → 増殖率=5, 生産率=5 (r2, r4, r5 が使用不能) g3, g4 の削除 → 増殖率=5, 生産率=5 (r2, r4 が使用不能) 使える反応セットは変わるが、代謝フローは変わらない T. Tamura, Trimming gene deletion strategies for growth-coupled production in constraint-based metabolic networks: TrimGdel, IEEE/ACM Transactions on Computational Biology and Bioinformatics, 20(2):1540-1549,

Slide 29

Slide 29 text

当初の増殖率と生産率を保証しつつ削除を減らす (TrimGdelのステップ3) g3, g4 の削除 → 増殖率=5, 生産率=5 (r2, r4 が使用不能) g4の削除 →増殖率=10, 生産率=10 (r2 が使用不能) 遺伝子削除数を減らすプロセスで、生産率がむしろ向上する例 T. Tamura, Trimming gene deletion strategies for growth-coupled production in constraint-based metabolic networks: TrimGdel, IEEE/ACM Transactions on Computational Biology and Bioinformatics, 20(2):1540-1549,

Slide 30

Slide 30 text

MILPで解の候補を探す 以下の制約を課したMILPで、遺伝子削除戦略の候補を見つける。 - 増殖率、生産率が閾値以上 - 使用不能な反応数が最大 - 上述条件を満たす中では増殖率最大 - GPRルールも含めて実装 ただし上述制約を除外した時の再現性は保証されないので、改めて 増殖率最大化時の目的物質生産率の最小値を評価する必要がある

Slide 31

Slide 31 text

GPRルールの線形表現 ◼ AND関数は以下のように、線形不等式に変換可能 1 ) ( ... ) ( ) ... ( 1 2 1 2 1 =         k k x x x x x x x k x x x x    = ... 3 2 1 1 ) 1 ( ... ) 1 ( 2 1  − + + − + k x x x 1 ) 1 ( 2 1  + − x x } 1 , 0 { ,..., , 2 1  k x x x Linear inequalities 1 ) 1 ( 1  + − k x x ….. Not applicable for MILP Applicable for MILP

Slide 32

Slide 32 text

◼ OR関数は以下のように、線形不等式に変換可能 1 ) ( ... ) ( ) ... ( 1 2 1 2 1 =         k k x x x x x x x k x x x x    = ... 3 2 1 1 ... ) 1 ( 2 1  + + + − k x x x 1 ) 1 ( 2 1  − + x x } 1 , 0 { ,..., , 2 1  k x x x Linear inequalities 1 ) 1 ( 1  − + k x x ….. GPRルールの線形表現 Not applicable for MILP Applicable for MILP

Slide 33

Slide 33 text

GPRルールの線形表現 上述の表現方法を使えば制約式は少なくて済む。

Slide 34

Slide 34 text

反応が使用不能になる場合の制約 - 反応速度の上下限: 𝑙𝑏 ≤ 𝑥 ≤ 𝑢𝑏 𝑝 ⋅ 𝑙𝑏 ≤ 𝑥 ≤ 𝑝 ⋅ 𝑢𝑏 - 𝑝: GPRルールの出力 - 𝑝 = 1の時は、元の上下限が適用される - 𝑝 = 0の時は、反応速度が強制的に0になる。

Slide 35

Slide 35 text

混合整数線形計画法 (MILP) による実装

Slide 36

Slide 36 text

混合整数線形計画法 (MILP) による実装 real

Slide 37

Slide 37 text

混合整数線形計画法 (MILP) による実装

Slide 38

Slide 38 text

混合整数線形計画法 (MILP) による実装

Slide 39

Slide 39 text

混合整数線形計画法 (MILP) による実装 (1) Theoretical Maximum Production Rate (TMPR) Theoretical Maximum Growth Rate (TMGR) の計算 増殖率と生産率のminimum requirementを計算

Slide 40

Slide 40 text

混合整数線形計画法 (MILP) による実装 (2) 増殖率と生産率が閾値以上、使用不能な反応数が最大 上述条件を満たす中では増殖率最大、を満たす遺伝子削 除戦略候補をMILPで計算

Slide 41

Slide 41 text

混合整数線形計画法 (MILP) による実装 (3) 解候補が実際に増殖連動生産を導くか、LPを解いて確認。 うまくいかなければ失敗リストに入れて、次の解候補を探す。

Slide 42

Slide 42 text

計算機実験で使用した代謝ネットワークの数理モデル iML1515: 大腸菌のゲノムスケールモデル iMM904: 酵母のゲノムスケールモデル e_coli_core: 大腸菌の概要モデル

Slide 43

Slide 43 text

iML1515(大腸菌)への計算機実験の結果 増殖連動生産が不可能なことを証明できる場合は 目的化合物から除外: 1877 → 1092 1092個の目的化合物のうち、436個に対して遺伝子削除 戦略の計算に成功

Slide 44

Slide 44 text

iML1515(大腸菌)への計算機実験の結果 遺伝子削除戦略の計算に成功した436個の目的化合物に おける、遺伝子削除数を分析 コア部分の抽出に必要な遺伝子削除数の平均は大きい。(963/1515) しかし増殖率や生産率を下げずに、削除数を減らせる。(134/1515)

Slide 45

Slide 45 text

iML1515(大腸菌)への計算機実験の結果 平均で134遺伝子削除とはいえ、かなりバラつきがある。 86%の目的化合物に対して、53遺伝子以下の削除

Slide 46

Slide 46 text

iML1515(大腸菌)への計算機実験の結果 ビオチン、パントテン酸、リボフラビン等のビタミンに対する 遺伝子削除戦略の計算。 リボフラビンに関しては遺伝子削除戦略は既知。

Slide 47

Slide 47 text

iMM904(酵母)への計算機実験の結果 782化合物のうち、109個で遺伝子削除戦略を計算できた。 平均削除遺伝子数は613/904から、54/904まで削減できた。

Slide 48

Slide 48 text

iMM904(酵母)への計算機実験の結果 平均で54遺伝子削除とはいえ、かなりバラつきがある。 91%の目的化合物に対して、36遺伝子以下の削除

Slide 49

Slide 49 text

他手法との比較 既存手法はゲノムスケールでは、ほぼ遺伝子削除戦略を計算できない

Slide 50

Slide 50 text

遺伝子削除戦略のデータベース MetNetComp https://metnetcomp.github.io/ database1/indexFiles/index.html 10生物種、1735化合物、 85611通りの遺伝子削除戦略 を掲載 T. Tamura, MetNetComp: Database for minimal and maximal gene-deletion strategies for growth- coupled production of genome-scale metabolic networks, IEEE/ACM Transactions on Computational Biology and Bioinformatics, 20(6):3748-3758,

Slide 51

Slide 51 text

増殖連動生産する遺伝子削除戦略の列挙 1. 使用不能な反応数が極大な遺伝子削除戦略 の抽出 2. 遺伝子数が極大な遺伝子削除戦略 3. Randomizedした貪欲法による、遺伝子数が極小な 遺伝子削除戦略の列挙 4. 代替可能な遺伝子セットに着目した明らかな 重複列挙の会費

Slide 52

Slide 52 text

Minimum and maximum gene deletion strategies for growth coupled production

Slide 53

Slide 53 text

遺伝子削除戦略のデータベース MetNetComp https://metnetcomp.github.io/ database1/indexFiles/index.html T. Tamura, MetNetComp: Database for minimal and maximal gene-deletion strategies for growth-coupled production of genome-scale metabolic networks, IEEE/ACM Transactions on Computational Biology and Bioinformatics, 20(6):3748-3758,

Slide 54

Slide 54 text

遺伝子削除戦略のデータベース MetNetComp https://metnetcomp.github.io/ database1/indexFiles/index.html T. Tamura, MetNetComp: Database for minimal and maximal gene-deletion strategies for growth-coupled production of genome-scale metabolic networks, IEEE/ACM Transactions on Computational Biology and Bioinformatics, 20(6):3748-3758,

Slide 55

Slide 55 text

No content

Slide 56

Slide 56 text

まとめと今後の課題 - 微生物の代謝ネットワーク改変による有用物質生産 → 代謝の定常状態を仮定した数理モデル (制約モデル) - 細胞増殖率最大化時の目的物質生産量を評価 - 抑制される反応数が最大となる代謝フローから遺伝子削除 戦略を逆算する手法 gDel_minRN - gDel_minRNで得られたコア部分から、小さな遺伝子削除 戦略を計算する手法 TrimGel - プログラムはGitHubで公開。個別の目的化合物に対する 遺伝子削除戦略の可視化データベースMetNetCompを開発 - All models are wrong, but some models are useful. であり、生物実験による検証が必要 https://metnetcomp.github.io/ database1/indexFiles/index.html