作られては消えていく泡のように儚いクラスタの運用話

2014/08/29 YAPC Asia 2014 Tsuyoshi Torii (@toritori0318) Bascule Inc. 作られて
消えていく泡ように儚いクラスタ運用話

自己紹介 • 鳥居剛司 Tsuyoshi Torii • @toritori0318 • 株式会社バスキュール
• Node.js / Python / Perl / Ruby • 二児父

DEV Ops

主にTVとスマートフォンを同期して云々〜といった仕事をしています

BloodyTube 血液型対抗レースに視聴者が参加して番組を構成する完全インタラクティブTV バスキュール企画・提供・制作視聴者スマホから参加状況がテレビに反映される優勝チームにリアル店舗で利用できるPontaポイントが提供される B2O2O(Broadcast
to Online to Offline)マーケティング施策にもチャレンジ http://pieces.bascule.co.jp/2014/bloodytube/en/

https://www.bascule-go.com/product/

About MIES • Sonischooter – リアルタイム同期／タイムライン／Elastic Socket.ioクラスタ • Harvestmoon –
ユーザアクション（投票／投稿など）を受付／集計 • Persona – MIES／コンシューマユーザ統合 – SNS連携 • Kanten(tofuクローン) – 画像変換 • ELF – 視聴ログ集計／解析 • Punisher – TV案件用ベンチマーククラスタ

今日話すこと

•TV案件特徴 •性能評価とか監視とか •運用改善話そ１ •運用改善話そ２ •今後改善していきたいこと

今日話さないこと

•フロントエンド話 •アプリケーションレイヤ話 •闇 – キャパシティガ〜 – クラウドフロントガ〜 –
イーエルビーガ〜 – ジーエーイーガ〜

TV案件特徴

運用サイクル

運用例 • １週間前にティザーサイト公開 – ロールごとに最小インスタンス数で構築 • 放送日前日〜当日 – インスタンスを数十台〜数百台起動 –
放送時間に張り付き監視 – 終了後バックアップ • 当日〜数日後 – 全てインスタンスを一括削除

TV連動運用 • 基本「放送時間」 – 案件によって異なる • ティザーサイトがある場合も • １回きり／２−３回／毎日／毎週
• 想定ユーザ数バラバラ • コストも割とシビア • 本番稼働しているサーバ（特に放送時間中）に対して変更を行うことあまりない(*1) (*1)サーバに限るかつ条件付き

負債回収

• 特に忙しい時期 – 期末期初／年末年始 • 作ったも本番終了後に削除 • ０から作り直す／まとまって空いている期間がある
で技術的負債を返済しやすい環境であるといえる ※あくまで現時点話

ここまでが TV案件特徴について

性能評価／監視話

性能評価

アクセスパターンについて

• 曜日／時間帯／企画内容からユーザ規模がある程度想定できる • アクセスパターンをある程度把握できるで、ど部分に負荷が集中しやすいか事前に特定できる •
本番怖い

本番怖い

一発勝負

Punisher

Punisher • NodeJS製ベンチマーククラスタ • スクリプトをJavascriptで記述 • 機能 – リアルタイムで開始／停止が可能 –
リアルタイム集計（タスク集計み） – AWS全リージョン対応 • １コマンドでAWS全リージョンインスタンスを起動／分散デプロイ – スポットインスタンス(半)自動入札

書いた理由

状況を完璧に再現したい

シナリオ例 • 30分間に30万人が以下処理を行う 1. ログイン • 内８割がゲストユーザ／２割がSNS接続ユーザ 2. APIサーバに情報取得
3. 非同期で30秒ごとにhogehogeAPI実行 4. Socketサーバに接続 • 内８割がwebsocket／２割がxhr-polling • 30万接続した状態でブロードキャスト送信 1. 5-15秒後にAPIサーバに対して投票処理 2. etc…

（良い）副作用シナリオを書くことによって事前にあぶない部分が判明する

安心感

監視

監視（放送当日以外） • Nagios／Munin • インスタンスタグから自動でコンフィグファイルを作成するような自前ツール • メール＆
IRC > HipChat > Slack • もう少しオシャレにしたい – Sensu〜♪

監視（放送日当日） • 負荷が来る日時が予めわかっている – 放送時間に張り付き監視 • 全体的な監視 – CloudWatch –
Proteus-Monitor – ソケットクラスタ管理ツール（独自） • ロールごと個別監視 – top – vmstat – tail –f error.log – App::RedisTop(*1) (*1)https://github.com/toritori0318/p5-App-RedisTop

Proteus-Monitor

Proteus-Monitor • リアルタイムで各サーバ CPU/Load/Mem/Net/etc…が確認できる • サーバ一覧で確認できる • 設定がお手軽 • Nodeが動的に追加／削除される
• 過去指標残らない • 名前でフィルタできるようにパッチをあてている

ソケットクラスタ管理ツール

ここまでが性能評価／監視話

運用改善話そ１

そ前にMIES 話 • 最初から「MIESを作るぞ！」という目的があったわけでない • 案件をこなしていくうちに「こ部分
共通化できそう」「こ部分汎用化しておくと開発楽だよ」といった感じでエンジニアが自発的にアイデアを出し、一つ一つカタチにしていったら自然に出来上がっていた • 当初機能重視で開発 • 一つ一つサービス独立していて疎結合

•３人 –TD or 独自アプリケーション（１名） –TD or MIESコア開発運用（１名） –MIESコア開発運用（１名） Server Team

サービス言語デプロイ／スケール Person Sonicshooter （リアルタイム同期系） Node.js App::Rad(*1) + Capistrano
Harvestmoon （アンケート受付） Python Fabric Persona （認証） Python App::Rad + Capistrano Kanten （画像変換） Perl Yoga(*2) (*2) https://github.com/toritori0318/p5-Yogafire (*1) http://d.hatena.ne.jp/tori243/20120622/1340386116

俺が、俺がSPOFだ!

問題 • サービス毎秘伝タレ – 開発環境／デプロイ／構築／スケール管理 • １サービス毎に運用出来る人が一人 •
運用コスト – スクリプト化しているが手順がバラバラ – 他人が手順を知らない or 知るが大変 – 工数がかかる – お金がかかる

解決したいこと • 全てサービスで仕組みを共通化 – 開発フロー／デプロイ／クラスタ構築／スケール管理 • これらを同じインタフェース（コマンド）で統一したい • 引き継ぎしやすくなる
• CIしやすくなる • 誰でもミス無く簡単に運用できる • コストダウンに繋がる

解決策

• 開発フロー／デプロイ – Vagrant + vagrant-aws + chef-deploy • プロビジョニングツール
– Chef+Berkshelf • クラスタ管理 – AWS CloudFormation • スケールコントロール – AWS AutoScaling

MIES-Provision-Task

MIES-Provision-Task • Rakeタスク – 基本的に vagrant／aws-cli ラッパー • Vagant +
vagrant-aws + vagrant-amiで統一化 • プロビジョニング Vagrant-chef-solo-provisioner • デプロイ chef-deployリソース • クラスタ管理 CloudFormation • スケール管理 AutoScaling

ざっくり補足

開発フロー

開発フロー • VagrantfileにVM リストを設定(*1) • Chefレシピ（nodes）もVMに合わせて作成(*1) • vagrantコマンド(Rakeでラップ)でVM起動／プロビジョニング／ssh／削除／イメージ保存を行う •
複数サーバへデプロイ行わず、AMIを作るだけ操作を行う（CloudFomation用 AMI） • CloudFormationテンプレートロール毎に用意しておき、Rakeタスク内でマージ • クラスタへ反映 CloudFormationでAMIを更新することで行う (*1) 管理単位「環境（＋ロール）」

VM管理例 • local • aws_hm_dev • aws_hm_stg • aws_hm_prd_wap •
aws_hm_prd_redis Chefレシピ／AMIもこ単位で管理

イメージ保存

イメージ保存 • vagrant-ami – vagrant-aws 設定を共有できる – Packer 不採用 –
fakepackerというRakeタスクを作成（後述） % vagrant create-ami --name my-ami \ --desc "My AMI” --tags role=test,environment=dev *参考 http://d.hatena.ne.jp/toritori0318/20130820/1377018423

スケール管理

スケール管理 • CloudFormation パラメータで指定 • Rakeタスクでも用意しておく(後述)

インフラ共通化

Chef cookbooks • 全サービスである程度共通化したbase-cookbookを用意 – ユーザ周り – openssh/ntp/timezone/nrpe/etc… – ssh周り
設定 – Alias or symlink( sv=“supervisorctl” / dstat-full=“dstat –Tclmdrn” ) – 最低限カーネルパラメータ – xbuild (node/python/perl/ruby) / fluentd / munin-node / supervisord – ディレクトリ（アプリケーション／アプリケーションログ／etc…） • ベースAMI作成する時にこれらを適用する

Supervisor • Python製デーモン管理ツール • 一度に複数デーモンを操作／自動リスタートなど対応 • グループ機能を利用 – 例
• supervisorctl restart all # supervisor全管理プロセス • Supervisorctl restart wap: # nginx / webapp • Supervisorctl restart redis: # redis_6379 / redis_6380 / … • Supervisorctl restart worker: # ワーカー全般

補足終わり

Rakeタスク

Local VM Task • rake local:up • rake local:provision [deploy=1]
• rake local:spec • rake local:destroy • rake local:ssh

AWS Task • rake aws:create_baseami • rake aws:up vm=<vm_name> •
rake aws:provision vm=<vm_name> [deploy=1] • rake aws:spec vm=<vm_name> • rake aws:destroy vm=<vm_name> • rake aws:ssh vm=<vm_name> • rake aws:create_ami vm=<vm_name> • rake aws:link_instance vm=<vmname> id=<instance_id> • rake aws:unlink_instance vm=<vmname>

AWS Task • rake aws:fakepacker vm=<vmname> – up > provision
> spec > create_ami > destroy

AWS CloudFormation Task • rake aws_cf:generate_cf_json env=<env_name> • rake aws_cf:create_stack
env=<env_name> • rake aws_cf:update_stack env=<env_name> [<key>=<value>] • rake aws_cf:delete_stack env=<env_name>

タスクTips • 任意クックブックを指定 – rake aws:provision vm=hoge chef_json=nodes/base.json •
差分実行 – rake aws:up vm=hoge ami=ami-xxxxxxxxx • 複数タスク実行 – rake aws:up aws:provision aws:create_ami vm=hoge – rake aws:up aws:ssh vm=hoge

タスクTips • rake vms

解決

ここまでが運用改善話（そ１）

運用改善話そ２

問題 • 同時並行案件が増えてきた… – アプリレイヤーで複数対応しているが、インフラ …？

問題 • 案件による規模違い – 案件A：ティザー２週間＋本番２回：規模１０万人 – 案件B：毎週金曜レギュラー：規模１万人 – 案件C：本番１回：規模１００万人
• コスト問題 • 単発番組／レギュラー番組 – 他案件用に改修入りそうだけどレギュラー番組で動いてるに影響出たらどうしよう…

解決案 • AWSアカウントを案件毎に分けて、別クラスタを構築出来るようにする – １クラスタにしない理由 • 規模によって別構築したい • 一度本番稼働している環境をいじる
が怖い – １アカウントで管理しない理由 • オペレーションまざるが怖い

手順共通化したし行けるで …！

現実 • AMI移動 ( or BaseAMI作り直し) • Keypair設定 • AWSキー更新(*1)
• アプリケーション改修 – MySQL／Redisサーバ／インスタンス数 • 案件／インスタンスタイプに合わせたワーカー数設定 – アプリケーション(gunicorn/cluster/starman)・SQSワーカーなど • これら再設定が終わったらchef実行し直す… • まーめんどい (*1) IAMロール使わない

さらなる解決案

案件ごとコンフィグレーションを一元管理してしまおう

Omniscient

Omniscient • サービス全体コンフィグレーションを管理 • 管理軸 – 案件毎／環境毎(dev/staging/stress/production) • アプリケーションコンフィグ(おまけ)
– サービス毎エンドポイント – サービス毎オプション設定 • インフラコンフィグ – AWS情報 – キャッシュ／Redis／RDS／などDB エンドポイント – ワーカープロセス数 – 自社製RedisCluster コンフィグ設定

Omniscient概要図クラスタ起動。同時にインスタンス情報を Omniscientに登録定期的にOmniscient 情報をPullし、更新されたらサーバに反映クラスタ起動。同時にインスタンス
情報を Omniscientに登録。アプリ側取得して反映

移行コスト改善〜♪

Serfも検討したが… • Serf – オーケストレーションツール – ゴシッププロトコロルを用い、クラスタ全体に何らかメッセージを伝搬 •
検証 – 複数軸で管理しようとした時、逆に複雑に • よい方法があれ〜

ここまでが運用改善話（そ２）

さらに改善していきたいこと

やりたいこと一覧 • Docker化 – 開発環境配布 – サービス環境配布 – プロダクション？ •
MIESサービス統合管理 • Omniscientゲートウェイ計画 • Rakeタスク Golang化

まとめ

• TV案件で 24時間365日稼働サービスとがんるところ／手を抜けるところが違う • 要件に合った運用改善〜 •
まだまだ改善したい〜 • 本番怖い

おまけ情報 • Rakeタスク／サンプルファイルなどブログにおいてありますでご参照下さい(若干古い) – http://d.hatena.ne.jp/toritori0318/20130916/1379355060 – https://github.com/toritori0318/vagrant-aws-sample

ご清聴ありがとうございました

作られては消えていく泡のように儚いクラスタの運用話

作られては消えていく泡のように儚いクラスタの運用話

More Decks by Tsuyoshi Torii

Other Decks in Technology

Featured

Transcript