SRE tools

SRE tools

サポーターズCoLab勉強会「SRE がよく利用するソフトウェアの理解と分類講座」で講演した資料です。 会場で、ホワイトボードを使い説明するためのカンペなので、ツールの詳細には触れていません。
不明点や訂正あれば、筆者にご連絡いただければ幸いです。
https://twitter.com/katsuhisa__

C0479b152c326746e911be790617f75b?s=128

katsuhisa_

June 07, 2018
Tweet

Transcript

  1. SRE tools Katsuhisa Kitano

  2. 株式会社スタディスト SRE チーム リーダー 北野 勝久 : @katsuhisa__

  3. なぜこのテーマで 勉強会をするのか?

  4. (自分が)昔めっちゃ困ってた時期があった • コード管理されておらず、 ブラックボックス化したインフラ • 障害っぽいのが発生しても、 モニタリングが貧弱で、状況がすぐにつかめない • でも、何からやったらいいか分からないし、 周辺技術もたくさんあるし、混乱

  5. 何が分からないかもよく分からないので、 思いつくまま ひたすら勉強をしていた

  6. それで身についたこともたくさんあるが、 正直、効率最悪で、時間の無駄だった

  7. せめて 全体像 が見えていれば、 闇雲に走る感覚はなかった (当時は ぼちぼち しんどかった)

  8. ➪ 1年前の自分に向けたテーマ

  9. SRE?

  10. SRE? • Google 発 • ソフトウェアエンジニアが、 システム運用を設計したらどうなるか?という観点で 再定義されたシステム管理者の役割 • class

    SRE inplements DevOps ◦ それ以外の役割も担う ◦ 「それ以外の役割」は、各社で、けっこう異なる
  11. 今日お話する範囲

  12. 今日お話しする範囲について • 話さないこと ◦ いわゆるシステム管理者に求められる ベースのスキルセット部分の話 ▪ OS, ネットワーク, DB

    など ▪ インフラのアーキテクチャ • 話すこと ◦ 上記以外のSRE の責務範囲の枠組み ◦ 目的を果たすために扱うメジャーなツールの解説 ◦ また、私が利用しているツールに関しては、より詳しく触れます
  13. 以降のページの スライド進行について

  14. 分類

  15. 分類 • サブ分類 ◦ 代表的なツール • サブ分類 ◦ 代表的なツール or

    • 代表的なツール • 代表的なツール • 代表的なツール
  16. この形式を繰り返します

  17. ツールの解説はホワイトボード使うので、 必要であれば適宜メモをお願いします

  18. 注意点 • 整理・分類は他社と理解が異なる場合あり • また、分類は必ずしもMECE になっていない • (今回の講義のために、自分の業務を無理やり分類した感は若干ある)

  19. AWS, GCP, Azure で類似サービスがある場合 AWS のサービスをメインで紹介しています (私の業務がAWS メインなので、ごめんなさい・・・)

  20. Infrastructure as Code

  21. Infrastructure as Code • インフラリソース作成 ◦ Terraform ◦ AWS CloudFormation

    • プロビジョニング ◦ Ansible ◦ Chef • インフラテスト ◦ Serverspec • マシンイメージ作成 ◦ Packer
  22. Monitoring

  23. Monitoring • たくさんありすぎる • それぞれのツールの特徴や使いやすさが異なっており、 いくつかを併用して使う会社も多い ◦ NewRelic ◦ DataDog

    ◦ AWS CloudWatch ◦ GCP Stackdriver ◦ Mackerel ◦ Prometheus ◦ Zabbix ◦ Elasticsearh / Kibana
  24. Log

  25. Log • ここでは、ログ転送するためのツールを意味して記載 また、ログ転送だけでなく、フィルタリングや加工などもできる ◦ fluentd ◦ Beats / Logstash

  26. ChatOps

  27. ChatOps • Slack などのチャットツールから、 コマンドなどを入力することで何かしらの作業を行う ◦ Hubot

  28. CI/CD

  29. CI/CD • CI/CD ◦ Circle CI ◦ Travis CI ◦

    Spinnaker ◦ Jenkins ◦ AWS Codeシリーズ 複数のCode◦◦◦という名称のサービスを組み合わせることで、 CI/CD パイプライン全体を実現できるように準備されている (一発でパイプラインを構築する専用サービスも存在する)
  30. Development Environment

  31. Development Environment • 開発環境 ◦ Docker ◦ VirtualBox + Vagrant

  32. Infrastructure Automation

  33. Infrastructure Automation • イベント駆動アーキテクチャで、 インフラ操作自動化することを意図して記載 「◦◦が起きたら、XXXが起動し、△△する」の、XXX 部分 ◦ AWS Lambda

    ◦ StackStorm
  34. Security

  35. Security • いろいろありすぎて分類が難しいので、 いくつかの概念とツールだけつまんで紹介 • IDS ◦ OSSEC • IPS

    ◦ fail2ban / iptables • IDS/IPS ◦ Deep Security • WAF ◦ AWS WAF • Audit ◦ AWS CloudTrail
  36. Data

  37. Data • データ分析基盤づくりもSRE が担当している会社も多い • DWH / DaaS ◦ Redshift

    ◦ BigQuery • Storage + Query ◦ AWS S3 + Athena • 前処理 / 転送 ◦ AWS Kinesis Family ▪ GCP の類似ツールは設計思想に癖があるので、サブセットではないとご理解ください • BI ◦ Redash ◦ Metabase ◦ DOMO ◦ AWS QuickSight
  38. Incident Management

  39. Incident Management • インシデント管理 ◦ PagerDuty • ステータス管理 ◦ Statuspage

  40. Performance Test

  41. Performance Test • ここもツールがたくさんあるので、いろいろ調べるとおもしろいです ◦ Apache JMeter ◦ Gatling

  42. まとめ

  43. いっぱいあって、初学者には、 たいへんに見えるかも それぞれの役割を確実に理解していけば、 ツールの使いどころは、 すぐ分かるようになります

  44. たいへんそうと思った人?

  45. 分からないことあれば、 いつでも聞いてください! : @katsuhisa__

  46. Copyright (C) 2018 Studist Corporation. All Rights Reserved 46 #devsumiE

    自己紹介 We are hiring!! スタディストでは、 いっしょに闘ってくれるSRE を募集中
  47. 懺悔 • SRE が使うツールという 雑なくくりはかなり乱暴だったかも • ツールという表現も適切じゃないかも…と何度も思いましたが、 ツール以外の良い表現が思い浮かばなかった ◦ 中の人で、ツール呼ばわりされて気を悪くされる方がいたら

    本当にすみません…