Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
KubeCon___CNCon_でみた最近のPrometheus.pdf
Search
yosshi_
December 27, 2018
Technology
230
1
Share
KubeCon___CNCon_でみた最近のPrometheus.pdf
yosshi_
December 27, 2018
More Decks by yosshi_
See All by yosshi_
Getting Started with Kubernetes Observability
yosshi_
8
2.7k
PromQL_Compatibility_Testing_Recap
yosshi_
0
1.2k
プロダクト誕生の背景から学ぶ PrometheusとGrafana Loki
yosshi_
11
3.8k
これから学ぶKubernetesのReconciliation Loop
yosshi_
15
5.1k
伝統的なエンプラ企業で取り組むインフラの設計書のモダナイゼーション.pdf
yosshi_
13
6.3k
KubeCon2019_NA_Recap__NATS_.pdf
yosshi_
0
210
“Running Apache Samza on Kubernetes” Recap : KubeCon2019@NA
yosshi_
3
1.3k
Kuberntes_Monitoring_入門.pdf
yosshi_
17
3.2k
Kubernetes_Logging入門.pdf
yosshi_
18
7.9k
Other Decks in Technology
See All in Technology
個人AIからチームAIへ:開発における品質と生産性の再設計
moongift
PRO
0
370
Chart.js が簡単に使えるようになっていたので OGP 画像生成に使った話
kamekyame
0
140
最低限これだけ押さえれ大丈夫_Claude Enterprise/Team企業展開ガバナンス入門
tkikuchi
1
710
はじめてのDatadog
kairim0
0
260
コードレビューを制するチームがソフトウェアデリバリーのフローを制す / Beyond Code Review: Distributing Its Responsibilities Across the SDLC
mtx2s
3
860
AIを「創る」と「使う」の循環 — HRテックが実践するリアルなAI組織実装
taketo957
0
1.1k
トークン数だけでは測れない — Claude Code 組織展開の効果検証から学んだこと
makikub
0
120
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
160
実装は速くなった、レビューはどうする? ― 自身のレビューをAIで再現させるサーヴァントエンジニアリングのすゝめ / Implementation got faster. So what about reviews? — An invitation to Servant Engineering: Recreating your own code reviews with AI
nrslib
6
3k
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
2
200
Gradle×GitHub_ActionsでCI時間を約50%短縮 ジョブ分割の設計と落とし穴 / Cutting CI Time by ~50% with Gradle and GitHub Actions: Job-Splitting Design and Pitfalls
takatty
0
610
Java正規表現エンジン(NFA)の仕組みと パフォーマンスを維持するための最適化手法
takeuchi_132917
0
180
Featured
See All Featured
Leo the Paperboy
mayatellez
7
1.8k
Making Projects Easy
brettharned
120
6.7k
Designing for Timeless Needs
cassininazir
1
250
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Building the Perfect Custom Keyboard
takai
2
780
BBQ
matthewcrist
89
10k
Building an army of robots
kneath
306
46k
Making the Leap to Tech Lead
cromwellryan
135
9.9k
HDC tutorial
michielstock
2
690
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
We Have a Design System, Now What?
morganepeng
55
8.2k
Transcript
ç KubeCon + CNCon でみた 最近のPrometheus KubeCon+CNCon NA 2018 Recap!!@Cybozu
@yosshi_
⾃⼰紹介 n 吉村 翔太(@yosshi_) n NTTコミュニケーションズ所属 n データサイエンスチーム n インフラエンジニア/データエンジニアリング
n Kurbernetes、Kafka etc n コミュニティ活動 “Cloud Native Developers JP”
What is Prometheus? 参考< https://prometheus.io/docs/introduction/overview/ > Googleで使⽤していた監視ツール「Borgmon」を参考にしたらしい 所感:メトリクスを取り扱うのが得意
Architecture 参考< https://prometheus.io/docs/introduction/overview/ >
Kubeconの参加前に気になってたこと n 可⽤性/拡張性 n 冗⻑化構成 n 監視対象が増加した際の性能の維持 n ログの⻑期保管
Prometheusだけで出来そうなこと - 信頼性 n SPOFを無くしたい LB Act-Act LBでヘルスチェック Prometheus Grafana
Target 2個作ってもいいよね
Prometheusだけで出来そうなこと - 拡張性 n監視対象が増えても通知のレスポンスは落としたくない Prometheus 1 Grafana 1 Target 1
2系統作ればいいじゃないか Target 2 Prometheus 2 Grafana 2
Prometheusだけで出来そうなこと - ⻑期保管 n キャパシティプランニング⽤に欲しい 外部ストレージに書き出せば 参考< https://prometheus.io/docs/prometheus/latest/storage/#remote-storage-integrations >
Prometheusだけで出来そうなこと - ⻑期保管 多段にしても何とかなるか? Target Grafana 監視⽤ Prometheus ⻑期保管⽤ (保管期間1年)
Grafana ⻑期保管⽤ Prometheus 監視⽤ (保管期間14⽇) 特定のメトリクスだけ収集
Kubeconでの収穫 n Cortex - Infinitely Scalable Prometheus n URL(https://sched.co/GrXL) n
Adopting Prometheus the Hard Way n URL(https://sched.co/GrXX) n Large Scale Automated Storage with Kubernetes n URL(https://sched.co/Gsxn) n Intro: Prometheus nURL(https://sched.co/GrXX)
Friends of Prometheus Thanos/Cortex/M3 参考< https://kccna18.sched.com/event/GrXX>
Prometheusで最初に⽬指した世界 参考< https://improbable.io/games/blog/thanos-prometheus-at-scale > n Target毎にPrometheusを配置 n フェデーレションを使って、横断してみれるPrometheus ダメでした 構成は複雑だし
遅くなる
What is Thanos 参考< https://improbable.io/games/blog/thanos-prometheus-at-scale > n Sidecarを使って、複数のPrometheusを1個⾒せてるふう VitessとMySQLの 関係に似てるな
Thanosの分散処理 n Querierが神様になって処理を分散してくれる よく⾒る “神”&”Sidecar”パターンですね 既存のプロダクトを“神”&”Sidecar”でスケールするのってKube界に多いですね。
Thanosの⻑期保管 n SidecarさんがS3 or GCSに書いてくれる
What is Cortex ? LogoのURL < https://github.com/cortexproject/cortex > n CNCF
sandbox project n 特徴 n Horizontally scalable n Highly Available n Long-term storage n Multi-tenant 参考< https://sched.co/GrXL>
Architecture 参考< https://github.com/cortexproject/cortex/blob/master/docs/architecture.md> Prometheusの Remote write API Prometheusそのものを スケールさせようとはしていない 書き出し先の外部ストレージに
Queryの実⾏エンジンが付いてるふう
What is M3 参考< https://github.com/m3db/m3> nUberが開発 n分散型の時系列DB
参考< https://sched.co/Gsxn> UberでのM3の利⽤状況
参考< https://sched.co/Gsxn> UberでのM3の利⽤状況
Architecture 参考< https://eng.uber.com/m3/ > これもPrometheusのSidecar
Architecture 参考< https://eng.uber.com/m3/ > n etcdに書いてあるルールに応じて集計、圧縮して書き込んでくれる
【参考】盛り上がったKeynote Julia Evans(Stripe) Melanie Cebula(Airbnb) Matt Schallert(Uber) Celina Ward(Uber) 2⽇⽬朝(https://sched.co/GsxY)
1⽇⽬夜(https://sched.co/GsxA) 3⽇⽬朝(https://sched.co/Gsxn) 1⽇⽬朝(https://www.cncf.io/phippy/) Phippy(Simple PHP app) & Fiends
【参考】Phippy & Friendsの画像の⼊⼿先 参考< https://github.com/cncf/artwork/tree/master/other/phippy-and-friends >