サポーターズCoLab勉強会「SRE がよく利用するソフトウェアの理解と分類講座」で講演した資料です。 会場で、ホワイトボードを使い説明するためのカンペなので、ツールの詳細には触れていません。 不明点や訂正あれば、筆者にご連絡いただければ幸いです。 https://twitter.com/katsuhisa__
SRE toolsKatsuhisa Kitano
View Slide
株式会社スタディストSRE チーム リーダー北野 勝久: @katsuhisa__
なぜこのテーマで勉強会をするのか?
(自分が)昔めっちゃ困ってた時期があった● コード管理されておらず、ブラックボックス化したインフラ● 障害っぽいのが発生しても、モニタリングが貧弱で、状況がすぐにつかめない● でも、何からやったらいいか分からないし、周辺技術もたくさんあるし、混乱
何が分からないかもよく分からないので、思いつくまま ひたすら勉強をしていた
それで身についたこともたくさんあるが、正直、効率最悪で、時間の無駄だった
せめて 全体像 が見えていれば、闇雲に走る感覚はなかった(当時は ぼちぼち しんどかった)
➪ 1年前の自分に向けたテーマ
SRE?
SRE?● Google 発● ソフトウェアエンジニアが、システム運用を設計したらどうなるか?という観点で再定義されたシステム管理者の役割● class SRE inplements DevOps○ それ以外の役割も担う○ 「それ以外の役割」は、各社で、けっこう異なる
今日お話する範囲
今日お話しする範囲について● 話さないこと○ いわゆるシステム管理者に求められる ベースのスキルセット部分の話■ OS, ネットワーク, DB など■ インフラのアーキテクチャ● 話すこと○ 上記以外のSRE の責務範囲の枠組み○ 目的を果たすために扱うメジャーなツールの解説○ また、私が利用しているツールに関しては、より詳しく触れます
以降のページのスライド進行について
分類
分類● サブ分類○ 代表的なツール● サブ分類○ 代表的なツールor● 代表的なツール● 代表的なツール● 代表的なツール
この形式を繰り返します
ツールの解説はホワイトボード使うので、必要であれば適宜メモをお願いします
注意点● 整理・分類は他社と理解が異なる場合あり● また、分類は必ずしもMECE になっていない● (今回の講義のために、自分の業務を無理やり分類した感は若干ある)
AWS, GCP, Azure で類似サービスがある場合AWS のサービスをメインで紹介しています(私の業務がAWS メインなので、ごめんなさい・・・)
Infrastructure as Code
Infrastructure as Code● インフラリソース作成○ Terraform○ AWS CloudFormation● プロビジョニング○ Ansible○ Chef● インフラテスト○ Serverspec● マシンイメージ作成○ Packer
Monitoring
Monitoring● たくさんありすぎる● それぞれのツールの特徴や使いやすさが異なっており、いくつかを併用して使う会社も多い○ NewRelic○ DataDog○ AWS CloudWatch○ GCP Stackdriver○ Mackerel○ Prometheus○ Zabbix○ Elasticsearh / Kibana
Log
Log● ここでは、ログ転送するためのツールを意味して記載また、ログ転送だけでなく、フィルタリングや加工などもできる○ fluentd○ Beats / Logstash
ChatOps
ChatOps● Slack などのチャットツールから、コマンドなどを入力することで何かしらの作業を行う○ Hubot
CI/CD
CI/CD● CI/CD○ Circle CI○ Travis CI○ Spinnaker○ Jenkins○ AWS Codeシリーズ複数のCode○○○という名称のサービスを組み合わせることで、CI/CD パイプライン全体を実現できるように準備されている(一発でパイプラインを構築する専用サービスも存在する)
Development Environment
Development Environment● 開発環境○ Docker○ VirtualBox + Vagrant
Infrastructure Automation
Infrastructure Automation● イベント駆動アーキテクチャで、インフラ操作自動化することを意図して記載「○○が起きたら、XXXが起動し、△△する」の、XXX 部分○ AWS Lambda○ StackStorm
Security
Security● いろいろありすぎて分類が難しいので、いくつかの概念とツールだけつまんで紹介● IDS○ OSSEC● IPS○ fail2ban / iptables● IDS/IPS○ Deep Security● WAF○ AWS WAF● Audit○ AWS CloudTrail
Data
Data● データ分析基盤づくりもSRE が担当している会社も多い● DWH / DaaS○ Redshift○ BigQuery● Storage + Query○ AWS S3 + Athena● 前処理 / 転送○ AWS Kinesis Family■ GCP の類似ツールは設計思想に癖があるので、サブセットではないとご理解ください● BI○ Redash○ Metabase○ DOMO○ AWS QuickSight
Incident Management
Incident Management● インシデント管理○ PagerDuty● ステータス管理○ Statuspage
Performance Test
Performance Test● ここもツールがたくさんあるので、いろいろ調べるとおもしろいです○ Apache JMeter○ Gatling
まとめ
いっぱいあって、初学者には、たいへんに見えるかもそれぞれの役割を確実に理解していけば、ツールの使いどころは、すぐ分かるようになります
たいへんそうと思った人?
分からないことあれば、いつでも聞いてください!: @katsuhisa__
Copyright (C) 2018 Studist Corporation. All Rights Reserved 46#devsumiE自己紹介We are hiring!!スタディストでは、いっしょに闘ってくれるSRE を募集中
懺悔● SRE が使うツールという雑なくくりはかなり乱暴だったかも● ツールという表現も適切じゃないかも…と何度も思いましたが、ツール以外の良い表現が思い浮かばなかった○ 中の人で、ツール呼ばわりされて気を悪くされる方がいたら本当にすみません…