ç KubeCon + CNCon でみた 最近のPrometheus KubeCon+CNCon NA 2018 Recap!!@Cybozu @yosshi_

⾃⼰紹介 n 吉村 翔太(@yosshi_) n NTTコミュニケーションズ所属 n データサイエンスチーム n インフラエンジニア/データエンジニアリング n Kurbernetes、Kafka etc n コミュニティ活動 “Cloud Native Developers JP”

What is Prometheus? 参考< > Googleで使⽤していた監視ツール「Borgmon」を参考にしたらしい 所感:メトリクスを取り扱うのが得意

Architecture 参考< >

Kubeconの参加前に気になってたこと n 可⽤性/拡張性 n 冗⻑化構成 n 監視対象が増加した際の性能の維持 n ログの⻑期保管

Prometheusだけで出来そうなこと - 信頼性 n SPOFを無くしたい LB Act-Act LBでヘルスチェック Prometheus Grafana Target 2個作ってもいいよね

Prometheusだけで出来そうなこと - 拡張性 n監視対象が増えても通知のレスポンスは落としたくない Prometheus 1 Grafana 1 Target 1 2系統作ればいいじゃないか Target 2 Prometheus 2 Grafana 2

Prometheusだけで出来そうなこと - ⻑期保管 n キャパシティプランニング⽤に欲しい 外部ストレージに書き出せば 参考< >

Prometheusだけで出来そうなこと - ⻑期保管 多段にしても何とかなるか? Target Grafana 監視⽤ Prometheus ⻑期保管⽤ (保管期間1年) Grafana ⻑期保管⽤ Prometheus 監視⽤ (保管期間14⽇) 特定のメトリクスだけ収集

Kubeconでの収穫 n Cortex - Infinitely Scalable Prometheus n URL( n Adopting Prometheus the Hard Way n URL( n Large Scale Automated Storage with Kubernetes n URL( n Intro: Prometheus nURL(

Friends of Prometheus Thanos/Cortex/M3 参考<>

Prometheusで最初に⽬指した世界 参考< > n Target毎にPrometheusを配置 n フェデーレションを使って、横断してみれるPrometheus ダメでした 構成は複雑だし 遅くなる

What is Thanos 参考< > n Sidecarを使って、複数のPrometheusを1個⾒せてるふう VitessとMySQLの 関係に似てるな

Thanosの分散処理 n Querierが神様になって処理を分散してくれる よく⾒る “神”&”Sidecar”パターンですね 既存のプロダクトを“神”&”Sidecar”でスケールするのってKube界に多いですね。

Thanosの⻑期保管 n SidecarさんがS3 or GCSに書いてくれる

What is Cortex ? LogoのURL < > n CNCF sandbox project n 特徴 n Horizontally scalable n Highly Available n Long-term storage n Multi-tenant 参考<>

Architecture 参考<> Prometheusの Remote write API Prometheusそのものを スケールさせようとはしていない 書き出し先の外部ストレージに Queryの実⾏エンジンが付いてるふう

What is M3 参考<> nUberが開発 n分散型の時系列DB

参考<> UberでのM3の利⽤状況

参考<> UberでのM3の利⽤状況

Architecture 参考< > これもPrometheusのSidecar

Architecture 参考< > n etcdに書いてあるルールに応じて集計、圧縮して書き込んでくれる

【参考】盛り上がったKeynote Julia Evans(Stripe) Melanie Cebula(Airbnb) Matt Schallert(Uber) Celina Ward(Uber) 2⽇⽬朝( 1⽇⽬夜( 3⽇⽬朝( 1⽇⽬朝( Phippy(Simple PHP app) & Fiends

【参考】Phippy & Friendsの画像の⼊⼿先 参考< >