SRE Lounge#3 UZABASE

UZABASE SRE

• 阿南肇史 • 2016年7月 UZABASE 入社 – 前職はSIerでアドテク系Infra Enginner
• UZABASE SRE Team 所属 – Infra Team => SRE Team (2017/07〜現在) 自己紹介

Mission 経済情報で、世界をかえる Business Intelligence to Change Your World 私たちは、世界中で愛される経済情報インフラをつくります。あらゆる経済情報を人とテクノロジーの力で整理・分析・創出し、
ビジネスパーソンの生産性を高め、創造性を解放します。私たちは経済情報を通じて世界中の意思決定を支え、世界をかえます。

Our Services B2Bマーケティングエンジンソーシャル経済ニュース企業・業界情報プラットフォーム日本最大級のベンチャーデータベース 2009年 2008年創業 2014年
2016年 2017年

• ビジネスパーソンの情報収集・分析における課題を解決する最先端のプラットフォーム • 世界中の企業情報、業界レポート、市場データ、ニュース、統計、M&Aなどあらゆるビジネス情報をカバー https://jp.ub-speeda.com SPEEDAとは？

• SPEEDA ◦ インフラ＋ソフトウェアで新機能開発以外を担当 ▪ インフラの構築運用 ▪ サービス・ジョブの運用 ▪ プロダクト改善、本番バグ対応、管理ツール開発
• 社内 ◦ オフィスネットワーク構築運用 ◦ 社内システム・PC・各種アカウント管理 ◦ コーポレートサイト、各サービスのLPサイトの構築運用 SREの業務範囲

Kubernetes運用における開発チームとSREの関わり方本日のテーマ

1. Backgrounds 2. k8s Architecture 3. Deployment 4. Logging 5.
Monitoring Table of Contents

Version:1.0 LB Huge Monolithic App File Server

Version:1.0 LB Huge Monolithic App File Server ・小改修でも全体に影響・機能追加も大がかり・開発スピードが遅い
・デプロイが遅い・増大し続けるヒープ・頻繁なGC ・サーバ増設のコスト

Version:2.0 LB Huge Monolithic App File Server Int LB Microservice
with VMs

Version:2.0 LB Huge Monolithic App File Server Int LB Microservice
with VMs ・Microservice化・機能別に開発可能・インフラ依頼増加（開発スピードが上がらない）・多数のVM構築・リソース効率悪い・機能別にエンド　ポイント(LB)準備・運用コスト増加・ヒープ増加が緩やかに

Version:3.0 LB Huge Monolithic App File Server Microservice with k8s
Ingress

Product Development Team Site Reliability Engineering Team CI / CDまで開発チームで完結できる世界を作る
• アプリケーション開発 • テスト • コンテナイメージ作成 • デプロイ • 監視用エンドポイント作成 • Logging • Cluster全体の設定 • Nodeメンテナンス • Logging • Monitoring • Security • Kubernetes外のDataStore構築

Rancher Server Rancher Agent ・Rancher Dashboard ・Cluster追加 / 削除・ノード追加
/ 削除・Audit Logging ・Security Kubernetes Cluster rancher/agent rancher/agent rancher/agent rancher/agent Rancher Ingress service A : 8080 service B : 8080 Namespace A Namespace B external LB k8s Architecture

凡例ホスト毎でのコンテナ配備状況台で稼働全台で稼働全台で稼働スタック

Blue／Greenをバランサで切替開発k8sに e2eテスト環境をデプロイ自動テストを実行本番k8sの Blue環境にデプロイ kubectl ＋
Shell Script kubectl ＋ Shell Script

Rancher Ingress external LB Port: 10080 Namespace: foo-green Port: 11080
Namespace: foo-blue Aerospike Live 同じDatasourceを利用して blue環境でテスト Green環境で稼働 Blue/Green Deployment

Rancher Ingress external LB Port: 10080 Namespace: foo-green Port: 11080
Namespace: foo-blue Aerospike Live Blue環境へ切替バランサー操作含め Developmentチームが自由にデプロイできる状態に Blue/Green Deployment

• app-containerはログを標準（エラー）出力 • 各ノードにログファイルが出力 • logging-agentがログファイルをtail • Logging Backendへ送信 •
アーキテクチャ詳細は下記 https://kubernetes.io/docs/concepts/cluster-admi nistration/logging/ Logging Cluster-level Logging architecture

Logging SPEEDA Logging Architecture BigQuery • app-containerはログを標準（エラー）出力 – JSON形式で統一する •
namespaceごとにfluentdをdaemonsetで稼働 – プロジェクトごとに権限を分けることが可能 • BackendはBigQuery – table / schemaは自動生成

Logging 【Containerで標準出力（JSON形式）】【Node上のファイル（ネストした JSON形式）】各Nodeの /var/log/containers/[pod_name]-[namespace]-[container_name]-[container_id].log に出力

fluent-plugin-kubernetes_metadata_filter "log" カラムの内容を parseして取り出す開発チーム主導で自由にログを出力してアップロードする

Monitoring ・監視基盤としてPrometheus + Grafana を採用・k8sにNode-exporter、Prometheusのコンテナを稼働・k8sの各ノードで収集・データ保存期間は24時間・k8s外のPrometheusからfederationで収集・GrafanaでVisualize
・詳細は弊社tech blogを参照ください！　http://tech.uzabase.com/entry/2018/03/14/200512

Prometheus Monitoring k8s cluster App pods node node node App
pods App pods Node Exporter federation datasource Prometheus Alertmanager $ kubectl describe deployment prometheus --namespace=metrics Args: --config.file=/mnt/etc/prometheus.yml --storage.tsdb.retention=24h --web.external-url=$(EXTERNAL_URL)/prometheus Grafana

• 開発チームでデプロイまで完結する • SREはクラスター全体の設計に集中 • 権限を移譲することにより各チームが自律してプロジェクトに取り組める環境を作るまとめ

Any questions? Thank you for listening！

SRE Lounge#3 UZABASE

SRE Lounge#3 UZABASE

tanan

More Decks by tanan

Other Decks in Technology

Featured

Transcript

UZABASE SRE

• 阿南肇史 • 2016年7月 UZABASE 入社 – 前職はSIerでアドテク系Infra Enginner

Mission 経済情報で、世界をかえる Business Intelligence to Change Your World 私たちは、世界中で愛される経済情報インフラをつくります。あらゆる経済情報を人とテクノロジーの力で整理・分析・創出し、

Our Services B2Bマーケティングエンジンソーシャル経済ニュース企業・業界情報プラットフォーム日本最大級のベンチャーデータベース 2009年 2008年創業 2014年

• SPEEDA ◦ インフラ＋ソフトウェアで新機能開発以外を担当 ▪ インフラの構築運用 ▪ サービス・ジョブの運用 ▪ プロダクト改善、本番バグ対応、管理ツール開発

Kubernetes運用における開発チームとSREの関わり方本日のテーマ

1. Backgrounds 2. k8s Architecture 3. Deployment 4. Logging 5.

Version:1.0 LB Huge Monolithic App File Server

Version:1.0 LB Huge Monolithic App File Server ・小改修でも全体に影響・機能追加も大がかり・開発スピードが遅い

Version:2.0 LB Huge Monolithic App File Server Int LB Microservice

Version:2.0 LB Huge Monolithic App File Server Int LB Microservice

Version:3.0 LB Huge Monolithic App File Server Microservice with k8s

Product Development Team Site Reliability Engineering Team CI / CDまで開発チームで完結できる世界を作る

1. Backgrounds 2. k8s Architecture 3. Deployment 4. Logging 5.

Rancher Server Rancher Agent ・Rancher Dashboard ・Cluster追加 / 削除・ノード追加

凡例ホスト毎でのコンテナ配備状況台で稼働全台で稼働全台で稼働スタック

1. Backgrounds 2. k8s Architecture 3. Deployment 4. Logging 5.

Blue／Greenをバランサで切替開発k8sに e2eテスト環境をデプロイ自動テストを実行本番k8sの Blue環境にデプロイ kubectl ＋

Rancher Ingress external LB Port: 10080 Namespace: foo-green Port: 11080

Rancher Ingress external LB Port: 10080 Namespace: foo-green Port: 11080

1. Backgrounds 2. k8s Architecture 3. Deployment 4. Logging 5.

• app-containerはログを標準（エラー）出力 • 各ノードにログファイルが出力 • logging-agentがログファイルをtail • Logging Backendへ送信 •

Logging SPEEDA Logging Architecture BigQuery • app-containerはログを標準（エラー）出力 – JSON形式で統一する •

Logging 【Containerで標準出力（JSON形式）】【Node上のファイル（ネストした JSON形式）】各Nodeの /var/log/containers/[pod_name]-[namespace]-[container_name]-[container_id].log に出力

fluent-plugin-kubernetes_metadata_filter "log" カラムの内容を parseして取り出す開発チーム主導で自由にログを出力してアップロードする

1. Backgrounds 2. k8s Architecture 3. Deployment 4. Logging 5.

Monitoring ・監視基盤としてPrometheus + Grafana を採用・k8sにNode-exporter、Prometheusのコンテナを稼働・k8sの各ノードで収集・データ保存期間は24時間・k8s外のPrometheusからfederationで収集・GrafanaでVisualize

Prometheus Monitoring k8s cluster App pods node node node App

• 開発チームでデプロイまで完結する • SREはクラスター全体の設計に集中 • 権限を移譲することにより各チームが自律してプロジェクトに取り組める環境を作るまとめ

Any questions? Thank you for listening！