$30 off During Our Annual Pro Sale. View Details »

SRE tools

SRE tools

サポーターズCoLab勉強会「SRE がよく利用するソフトウェアの理解と分類講座」で講演した資料です。 会場で、ホワイトボードを使い説明するためのカンペなので、ツールの詳細には触れていません。
不明点や訂正あれば、筆者にご連絡いただければ幸いです。
https://twitter.com/katsuhisa__

katsuhisa_
PRO

June 07, 2018
Tweet

More Decks by katsuhisa_

Other Decks in Programming

Transcript

  1. SRE tools
    Katsuhisa Kitano

    View Slide

  2. 株式会社スタディスト
    SRE チーム リーダー
    北野 勝久
    : @katsuhisa__

    View Slide

  3. なぜこのテーマで
    勉強会をするのか?

    View Slide

  4. (自分が)昔めっちゃ困ってた時期があった
    ● コード管理されておらず、
    ブラックボックス化したインフラ
    ● 障害っぽいのが発生しても、
    モニタリングが貧弱で、状況がすぐにつかめない
    ● でも、何からやったらいいか分からないし、
    周辺技術もたくさんあるし、混乱

    View Slide

  5. 何が分からないかもよく分からないので、
    思いつくまま ひたすら勉強をしていた

    View Slide

  6. それで身についたこともたくさんあるが、
    正直、効率最悪で、時間の無駄だった

    View Slide

  7. せめて 全体像 が見えていれば、
    闇雲に走る感覚はなかった
    (当時は ぼちぼち しんどかった)

    View Slide

  8. ➪ 1年前の自分に向けたテーマ

    View Slide

  9. SRE?

    View Slide

  10. SRE?
    ● Google 発
    ● ソフトウェアエンジニアが、
    システム運用を設計したらどうなるか?という観点で
    再定義されたシステム管理者の役割
    ● class SRE inplements DevOps
    ○ それ以外の役割も担う
    ○ 「それ以外の役割」は、各社で、けっこう異なる

    View Slide

  11. 今日お話する範囲

    View Slide

  12. 今日お話しする範囲について
    ● 話さないこと
    ○ いわゆるシステム管理者に求められる ベースのスキルセット部分の話
    ■ OS, ネットワーク, DB など
    ■ インフラのアーキテクチャ
    ● 話すこと
    ○ 上記以外のSRE の責務範囲の枠組み
    ○ 目的を果たすために扱うメジャーなツールの解説
    ○ また、私が利用しているツールに関しては、より詳しく触れます

    View Slide

  13. 以降のページの
    スライド進行について

    View Slide

  14. 分類

    View Slide

  15. 分類
    ● サブ分類
    ○ 代表的なツール
    ● サブ分類
    ○ 代表的なツール
    or
    ● 代表的なツール
    ● 代表的なツール
    ● 代表的なツール

    View Slide

  16. この形式を繰り返します

    View Slide

  17. ツールの解説はホワイトボード使うので、
    必要であれば適宜メモをお願いします

    View Slide

  18. 注意点
    ● 整理・分類は他社と理解が異なる場合あり
    ● また、分類は必ずしもMECE になっていない
    ● (今回の講義のために、自分の業務を無理やり分類した感は若干ある)

    View Slide

  19. AWS, GCP, Azure で類似サービスがある場合
    AWS のサービスをメインで紹介しています
    (私の業務がAWS メインなので、ごめんなさい・・・)

    View Slide

  20. Infrastructure as Code

    View Slide

  21. Infrastructure as Code
    ● インフラリソース作成
    ○ Terraform
    ○ AWS CloudFormation
    ● プロビジョニング
    ○ Ansible
    ○ Chef
    ● インフラテスト
    ○ Serverspec
    ● マシンイメージ作成
    ○ Packer

    View Slide

  22. Monitoring

    View Slide

  23. Monitoring
    ● たくさんありすぎる
    ● それぞれのツールの特徴や使いやすさが異なっており、
    いくつかを併用して使う会社も多い
    ○ NewRelic
    ○ DataDog
    ○ AWS CloudWatch
    ○ GCP Stackdriver
    ○ Mackerel
    ○ Prometheus
    ○ Zabbix
    ○ Elasticsearh / Kibana

    View Slide

  24. Log

    View Slide

  25. Log
    ● ここでは、ログ転送するためのツールを意味して記載
    また、ログ転送だけでなく、フィルタリングや加工などもできる
    ○ fluentd
    ○ Beats / Logstash

    View Slide

  26. ChatOps

    View Slide

  27. ChatOps
    ● Slack などのチャットツールから、
    コマンドなどを入力することで何かしらの作業を行う
    ○ Hubot

    View Slide

  28. CI/CD

    View Slide

  29. CI/CD
    ● CI/CD
    ○ Circle CI
    ○ Travis CI
    ○ Spinnaker
    ○ Jenkins
    ○ AWS Codeシリーズ
    複数のCode○○○という名称のサービスを組み合わせることで、
    CI/CD パイプライン全体を実現できるように準備されている
    (一発でパイプラインを構築する専用サービスも存在する)

    View Slide

  30. Development Environment

    View Slide

  31. Development Environment
    ● 開発環境
    ○ Docker
    ○ VirtualBox + Vagrant

    View Slide

  32. Infrastructure Automation

    View Slide

  33. Infrastructure Automation
    ● イベント駆動アーキテクチャで、
    インフラ操作自動化することを意図して記載
    「○○が起きたら、XXXが起動し、△△する」の、XXX 部分
    ○ AWS Lambda
    ○ StackStorm

    View Slide

  34. Security

    View Slide

  35. Security
    ● いろいろありすぎて分類が難しいので、
    いくつかの概念とツールだけつまんで紹介
    ● IDS
    ○ OSSEC
    ● IPS
    ○ fail2ban / iptables
    ● IDS/IPS
    ○ Deep Security
    ● WAF
    ○ AWS WAF
    ● Audit
    ○ AWS CloudTrail

    View Slide

  36. Data

    View Slide

  37. Data
    ● データ分析基盤づくりもSRE が担当している会社も多い
    ● DWH / DaaS
    ○ Redshift
    ○ BigQuery
    ● Storage + Query
    ○ AWS S3 + Athena
    ● 前処理 / 転送
    ○ AWS Kinesis Family
    ■ GCP の類似ツールは設計思想に癖があるので、サブセットではないとご理解ください
    ● BI
    ○ Redash
    ○ Metabase
    ○ DOMO
    ○ AWS QuickSight

    View Slide

  38. Incident Management

    View Slide

  39. Incident Management
    ● インシデント管理
    ○ PagerDuty
    ● ステータス管理
    ○ Statuspage

    View Slide

  40. Performance Test

    View Slide

  41. Performance Test
    ● ここもツールがたくさんあるので、いろいろ調べるとおもしろいです
    ○ Apache JMeter
    ○ Gatling

    View Slide

  42. まとめ

    View Slide

  43. いっぱいあって、初学者には、
    たいへんに見えるかも
    それぞれの役割を確実に理解していけば、
    ツールの使いどころは、
    すぐ分かるようになります

    View Slide

  44. たいへんそうと思った人?

    View Slide

  45. 分からないことあれば、
    いつでも聞いてください!
    : @katsuhisa__

    View Slide

  46. Copyright (C) 2018 Studist Corporation. All Rights Reserved 46
    #devsumiE
    自己紹介
    We are hiring!!
    スタディストでは、
    いっしょに闘ってくれるSRE を募集中

    View Slide

  47. 懺悔
    ● SRE が使うツールという
    雑なくくりはかなり乱暴だったかも
    ● ツールという表現も適切じゃないかも…と何度も思いましたが、
    ツール以外の良い表現が思い浮かばなかった
    ○ 中の人で、ツール呼ばわりされて気を悪くされる方がいたら
    本当にすみません…

    View Slide