食べログ on Kubernetes ~ 運用15年以上の大規模レガシーシステムを Kubernetesに乗せていく~

Slide 1

Slide 1 text

Slide 2

Slide 2 text

© Kakaku.com Inc. All Rights Reserved. 2 下國峰昌(しもくにみねまさ) SREチーム技術専⾨職 2019年中途⼊社。⾷べログではSRE⼀本でやってきました最近の活動 • ⾷べログオーダーインフラ、CI/CD、モニタリング構築 • Google Dataflow + Big Queryでアクセス解析システムを刷新 • OpsGenieクライアントRuby gemの作成 • ⾷べログ既存システムのKubernetes化

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

© Kakaku.com Inc. All Rights Reserved. 15 なぜK8s化するのかデプロイ/ロールバックに時間がかかる。MTTRが⻑いサーバが増え続ける中、これ以上デプロイを⾼速にするのは、今のアーキテクチャでは厳しい。エンジニアがデプロイに捧げる時間を減らし、開発作業に集中できるようにしたい。デプロイ時間が縮まれば、デプロイ頻度も上げられる。また、デプロイ起因で障害が発⽣した際には、即座にロールバックできるようにしたい。

Slide 16

Slide 16 text

© Kakaku.com Inc. All Rights Reserved. 16 なぜK8s化するのかデプロイ/ロールバックに時間がかかる。MTTRが⻑い Kubernetes化すると、 Argo CDなどのKubernetes⽤ GitOps CDツールを使えば、デプロイ担当者は、GitHub上のプルリクエストをマージするだけで完了！ロールバックは、マージしたプルリクエストをリバートするだけ！ 3sec.

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

© Kakaku.com Inc. All Rights Reserved. 20 なぜK8s化するのか⼤量のサーバに対するインフラ作業がトイル Kubernetes化すると、ここを⼤幅に削減できる。 Dockerfileを書き換えてビルドし、applyするのみ(数秒) ※イメージです。現在のバージョンとは異なります • Ansibleを流す時間(下⼿すると3時間) • その間のシステムモニタリング

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

© Kakaku.com Inc. All Rights Reserved. 24 なぜK8s化するのか無数の歴史的負債があるが、それに⼿を⼊れるのが怖いこのNW 経路いる？このDB 接続いる？これデッドコードっぽいから消したいなこれ機能ごと別システムに切り出したいなこのシステムだけES6 使えないんだけどでもそれを検証するのに⼯数かかるし、えいやで出して障害起こしてもロールバックに時間かかるし触らんとこ。。。

Slide 25

Slide 25 text

© Kakaku.com Inc. All Rights Reserved. 25 なぜK8s化するのか無数の歴史的負債があるが、それに⼿を⼊れるのが怖い • リグレッションテストをきちんと⾏える環境がない • ステージング環境はあるけど、本番と微妙に違う • カナリアリリース/ブルーグリーンデプロイメントの仕組みがない • いきなり改修したコードに100%トラフィックが流れてしまう • コードの本番リリース後のロールバック機能がない • ミュータブルなVMへの構成変更はロールバック不可ために、歴史的負債の返済に⼿を出しづらい。

Slide 26

Slide 26 text

© Kakaku.com Inc. All Rights Reserved. 26 なぜK8s化するのか無数の歴史的負債があるが、それに⼿を⼊れるのが怖い Kubernetes化すると、 • 本番環境とほぼ同じステージング環境が⼿に⼊る • マニフェストで宣⾔的にインフラを定義できる • カナリアリリース等の仕組みが導⼊しやすい • 試しに1%だけ改修したコードへトラフィックを流せる • コードリリースを⼀瞬でロールバックできる • インフラがイミュータブルになり、変更がロールバック可能になるため、負債返済のための攻めのリリースができる ※リグレッションテスト環境も構築を進めています！⾷べログのソフトウェアテスト⾃動化デザインパターン

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

© Kakaku.com Inc. All Rights Reserved. 30 何からK8s化に着⼿するのか Kubernetes導⼊前の懸念難しいんでしょ？ => やってみなわからんわな新規サービスでお試し。⾷べログテイクアウトを、Google Kubernetes Engineで構築。インフラ担当2⼈、3ヶ⽉でサービスインできた。⼩さく始め、⼿応えを掴むところから始めた ※Googleの顧客事例にも取り上げられました https://cloud.google.com/blog/ja/topics/customers/kakaku-com-gke/

Slide 31

Slide 31 text

© Kakaku.com Inc. All Rights Reserved. 31 何からK8s化に着⼿するのか Kubernetes オンプレでいくかクラウドで⾏くかクラウドの魅⼒ • 運⽤に必要なものが⼀通り揃っている • 採⽤事例が多く、情報が多い • ノードの管理がほぼ不要 • これがしんどい • ECS + Fargateなどのマネージドサービス使えばもっと楽オンプレの魅⼒ • カカクコム社として統⼀的なプラットフォーム • ハイスペックなマシンを⼤量に並べるとなると圧倒的に安い • 80億req/⽉のネットワーキング料⾦となると圧倒的に安い => 原則オンプレでいくことに

Slide 32

Slide 32 text

© Kakaku.com Inc. All Rights Reserved. 32 何からK8s化に着⼿するのか Kubernetes化進めていくぜ早くKubernetesに乗せたいのはメインサービスのMonorepo。でも、オンプレKubernetesの運⽤ノウハウがなかったそこで、事故っても影響が⼩さく、簡素なシステムからKubernetes化していった。 1. 社内ツール 2. データベースを持たないステートレスなシステム 3. 他システムから参照されない独⽴したDBを⼀つだけ持つシステム

Slide 33

Slide 33 text

Slide 34

Slide 34 text

© Kakaku.com Inc. All Rights Reserved. 34 何からK8s化に着⼿するのか満を持してMonorepoのKubernetes化へ⼀旦、Monorepo上のアプリケーションすべてをKubernetes上で稼働させてしまうその後、ドメイン単位でVMからKubernetesへ切り替えていく =>影響範囲を局所化しつつ切り替え可能に INSERVICE INSERVICE MAINTENANCE MAINTENANCE Monorepo

Slide 35

Slide 35 text

Slide 36

Slide 36 text

© Kakaku.com Inc. All Rights Reserved. 36 どうやってK8s化していくのか⼤前提は、リフト & シフト⾷べログは、運⽤15年を過ぎた歴史あるシステム。 Kubernetes移⾏にあたってシステム全体を⾒回したとき、つい直したくなる地雷も多く埋まっている。しかし、いま⼤規模改修をしてもMTTRが⻑いまま。まずはMTTRを短くするためにKubernetesに乗せる。地雷を撤去していくのはそのあと。この⽬的を⾒失わずにやっていきます。

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

© Kakaku.com Inc. All Rights Reserved. 39 どうやってK8s化していくのかモニタリングどうすんの VM時代のホストベース監視ツールは使えない Kubernetes上ではPodが次々に⽣まれ変わるためサービスディスカバリ機能を備えた監視ツールが必要 ÞPrometheusを採⽤サーバAにはこの監視を、サーバBにはこの監視を…… Pod AもPod Bももういない？！ Pod Cは何を監視すれば？

Slide 40

Slide 40 text

Slide 41

Slide 41 text

Slide 42

Slide 42 text

© Kakaku.com Inc. All Rights Reserved. 42 どうやってK8s化していくのかモニタリングどうすんの監視の分断を避ける Kubernetesシステム全体を俯瞰できるダッシュボードが必要全てのデータをNewRelicへ集約し、システム全体状況を把握できるように • MW以上/OS: Prometheus & NewRelicへのremote write • Kubernetes層: NewRelic Kubernetes Integration

Slide 43

Slide 43 text

Slide 44

Slide 44 text

© Kakaku.com Inc. All Rights Reserved. 44 どうやってK8s化していくのかロギングどうすんのコンテナのログは標準出⼒に出⼒するのが基本です。ノードにfluentdなどを仕込み、ノードレベルでログを回収しましょう。とは⾏かないのが運⽤15年⽬のシステム。⼀つのRailsアプリケーションから、10種類を超える種類のログファイルを出⼒していることもある⽤途が違う10種類のログを、ごちゃっと⼀つの標準出⼒に出⼒するよう作り変えるのは⾟い

Slide 45

Slide 45 text

Slide 46

Slide 46 text

Slide 47

Slide 47 text

Slide 48

Slide 48 text

© Kakaku.com Inc. All Rights Reserved. 48 どうやってK8s化していくのかノード運⽤どうすんのこれがかなりきつい。何か障害が起きていることはわかる。でも何が原因かわからないことが多い。 • 事例1: 謎のノードメモリ使⽤量⾼騰 • dockerdのメモリリークが原因。Podたちは悪くなかった • 定期的にノードをdrainし、dockerdを再起動する運⽤ • 事例2: 謎の⼤量Pending Podの出現 • CRI経由でのdockerdへのリクエストの遅延が原因。Kubernetesは悪くなかった • なぜ遅延していたかまでは未だ不明 • dockerdのレイテンシを監視 & 再起動する運⽤ • 最終的にコンテナランタイムをdockerdからcontainerdへ変更した障害から学び、監視 & 運⽤を⽇々ブラッシュアップしていく覚悟が必要

Slide 49

Slide 49 text

Slide 50

Slide 50 text

Slide 51

Slide 51 text

Slide 52

Slide 52 text

Slide 53

Slide 53 text

Slide 54

Slide 54 text

Slide 55

Slide 55 text

Slide 56

Slide 56 text

© Kakaku.com Inc. All Rights Reserved. 56 どうやってK8s化していくのか⼤規模アセットどうする Monorepoには、image/js/css、pdfなどの静的コンテンツが1GBある従来、Webサーバで配布していたこれら静的コンテンツを、 Webサーバのイメージ内に含めてしまうと、コンテナのビルドサイズが巨⼤になり、ノードのディスクはおろか、イメージプルでネットワーク帯域を⾷いつぶしてしまう

Slide 57

Slide 57 text

Slide 58

Slide 58 text

Slide 59

Slide 59 text

© Kakaku.com Inc. All Rights Reserved. 59 まとめ • ⾷べログでは、⻑い歴史を持つMonorepoのつらみを解消するために、Kubernetes化を始めた • Kubernetesは複雑。⼩さく初めて徐々に広げていく • オンプレKubernetesはつらみも多いが、システム規模によってはコスト⾯で⼤きなメリットを得られる • ⾷べログではリフト&シフトでKubernetes化を進めている。気になる課題も多いが、その先にあるメリットを早く享受したいため

Slide 60

Slide 60 text

Slide 61

Slide 61 text