SRE NEXT 2022
https://sre-next.dev/2022/
[Speaker]
ヤフー株式会社 KaaS SRE 水落 啓太
[Description]
増大を続けているヤフーKubernetesクラスタ群(1,000+クラスタ, 400,000+コンテナ)のキャパシティ管理をシステム化し、キャパシティプラニングなどキャパシティに関する運用業務健全化に取り組んだ事例を紹介します。
私たちは、ヤフーの各種サービスを支えるプラットフォームとしてKubernetesクラスタを簡単に利用可能とするKaaS (Kubernetes as a Service) を運用するチームです。
旧来システムのシステム刷新や、ビジネスの伸びやキャンペーンに伴うシステム拡張といったイベントに応じて、ヤフーKaaSには、Kubernetesクラスタ利用の需要が絶えず生じています。私たちは、KaaS利用者の需要に答え続けるために、RDB, Go, Grafanaを活用し、Kubernetesクラスタ提供に必要なキャパシティ情報を的確に把握し、キャパシティに関する各業務を迅速・的確に推進するための仕組みを整えました。
SREの一分野であるキャパシティ管理の課題に、SREチームとして取り組む中で得られた知見を交えながら、SREの幅広さ・面白さに迫ります。