GKE@AbemaTV

GKE@AbemaTV Ryosuke Suto 2016/10/15 AbemaTV Developer Conference 2016

@strsk • 須藤涼介（Ryosuke SUTO） • （株）サイバーエージェント • 技術本部 • サービスリライアビリティグループ

Agenda • GKE is... • 選んだ理由 • 設計の話 • 運用、あれこれ

GKE is...

GKEとは • Google Container Engine • Kubernetesのフルマネージドサービス • 略すとGCEとかぶるため、KubernetesのK をとってGKE

Kubernetes くーばねいてぃす

Kubernetes（k8s）とは • Dockerのオーケストレーションツール • コンテナのグルーピングやネットワーク、監視などをマニフェストファイル（YAML）で管理する

Node1 Minion1 RC1 Pod1-1 Pod1-2 Pod2-1 Pod2-2 Service1 Service2 Kubernetesの構成
• Master：クラスタを管理 ◦ GKEでは表示されない • Minion：コンテナが起動するノード • Pod：コンテナのグループ • Replication Controller：起動するPod数や環境変数を管理(Deployments) • Service：Pod郡のエンドポイント

GKE@AbemaTV

iOS GCP Load Balancing Cloud DNS Cloud Storage Compute Engine
Redis Compute Engine MongoDB Stackdriver Monitoring Pub/Sub BigQuery Stackdriver Logging 画像基盤広告基盤 Client Backend Monitor CDN API/web Container Engine（GKE） Gateway Media Proxy コメントユーザー課金 web etc Logging Compute Engine transcoder 社内基盤ログ基盤スタジオ／ロケ地 Studio transcoder ここの話

アーキテクチャ • GKE • GCE • GCS • Stackdriver •
BigQuery • Cloud Pub/Sub • Redis, MongoDB • Varnish, Nginx

選んだ理由ワ　ケ

GKE（k8s）を選んだ理由 • GKEがGAに（2015年8月） • k8sのフルマネージドサービス • 活発な開発、アップデート • microservicesとの親和性

設計の話

SPEC • n1-highcpu-16 × 50node ◦ 16 vCPUs, 14.4 GB
memory • 33 Services • 216 Pods

SPEC • default requests & limits ◦ cpu: 4000m ◦
memory: 3Gi

RequestsとLimits • Requests ◦ Pod起動時に必要なリソース • Limits ◦ Podのリソース制限

RequestsとLimits • RequestsとLimitsに開きがあると高負荷時にMinionのリソースが枯渇する • Podスケール時にスケジュールしていた Limitsを超える可能性がある

RequestsとLimits • kubectl describe node [node]でリソース全体の何％まで割り当てられているか確認できる

1(cluster)×N(services) • 追加機能でインフラの準備不要◯ • 運用コストの低減◯ • 各service同士はlocalhostで接続◯

1(cluster)×N(services) • リソース消費の見極めが複雑化△ • レプリカ数が少ないPodは、タイミングによって同じノードに起動してしまうことがある△

Docker Image • 基本はAlpine Linux ◦ Docker向きの超軽量OS • デプロイの頻度が少ない、提供されていないパッケージがある場合はUbuntu

リリースフロー

Container Registry Container Cluster docker push deploy docker push push
test Docker Hub

kubectl • リソースの作成 kubectl create -f xxx.yml • 設定内容の更新 kubectl
apply -f xxx.yml

kubectl • Rolling-Update kubectl rolling-update xxx -f xxx.yml • Podのスケールアウト
kubectl scale rc xxx --replicas=10

kubectl rolling-updateの課題 • v1.2.0以降、同じタグ指定で Rolling-Updateができない • 途中で失敗するとSelectorが中途半端な状態で残ってしまう

kubetool

kubetool https://github.com/abema/kubetool • kubectlをラップした補助ツール • 一覧表示の改善 • カナリアリリース

kubetool • Podの一覧 kubetool pods • ReplicationControllerの一覧 kubetool rc

kubetool • Podの再作成 kubetool reload [rc] • RCのイメージ更新 kubetool update
[rc] [version]

kubetool • Podを1台だけ再作成 kubetool reload [rc] --1 • 残りのPodも最新にする kubetool
fix-version [rc]

監視

Stackdriver Monitoring/Logging • 標準で取れるのはリソース状況のみ • Podの標準出力はLoggingへ • 強力なフィルター機能 • ログベースメトリクスの作成が可能

kube-ui • 各コンポーネントの情報一覧 • Podの消費リソース • スケール • YAMLファイルの編集

運用、あれこれ

Terraformとの別離 • TerraformでInstance Templateを編集するとインスタンスが全台再作成される • 無停止でスケールアップ/ダウンする場合はテンプレートを手動で付け替える必要がある • コード化…

ServiceのIPに接続できない • HTTP Load Balancerからは繋がる • LAN内のインスタンスやPodから接続できない • v1.2.0でのバグ

Nodeアップグレード時に断発生 • 1台ずつアップグレードされるが、Podが先に落ちないため数秒団が発生 • Node Pool機能で段階的にアップグレードする方法が良い

まとめ

GKEをつかってみた感想 • Docker導入の敷居が低くなる • デプロイ簡単 • リソース調整にはコツがいる • DevOpsが捗る

May the Docker be with you.

GKE@AbemaTV

GKE@AbemaTV

More Decks by Ryosuke Suto

Other Decks in Technology

Featured

Transcript