Upgrade to Pro — share decks privately, control downloads, hide ads and more …


September 20, 2018


JDDStudy #3 (https://techplay.jp/event/687946) で発表した資料です。


September 20, 2018

More Decks by katsuhisa_

Other Decks in Technology


  1. • 北野 勝久 / @katsuhisa__ • SRE @ Studist Corporation

    • Organizer of SRE Lounge / Rails Developers Meetup • Developers Summit, / July Tech Festa 登壇 etc. • Linux カーネルと同い年
  2. CHAPTER 1 How SRE Relates to DevOps class SRE implements

    interface DevOps 『The Site Reliability Workbook』 ※日本語訳発売時期未定
  3. DevOps is a broad set of principles about whole-lifecycle collaboration

    between operations and product development. SRE is a job role, a set of practices we’ve found to work, and some beliefs that animate those practices. 『The Site Reliability Workbook 』より引用
  4. If you think of DevOps as a philosophy and an

    approach to working, you can argue that SRE implements some of the philosophy that DevOps describes, and is somewhat closer to a concrete definition of a job or role than, say, “DevOps engineer.” So, in a way, class SRE implements interface DevOps. Given that trajectory, the discipline as a whole currently does not foreground cultural change by default quite as much as DevOps. 『The Site Reliability Workbook 』より引用
  5. VS. ブラックボックス地獄 • インフラをコード化 ◦ 2週間かけて、全環境AnsibleのPlaybook化 • GitHub でコードのバージョン管理 ◦

    Pull Request ベースで仕事できるの大事 • テスト駆動で開発できるようにServerspec導入
  6. インフラもバージョン管理しような って書いてるレポート The benefits of version control shouldn’t be limited

    to application code; in fact, our analysis shows that organizations using version control for both system and application configurations have higher IT performance. (職場で、エライ人に何か言われた時のための理論武装としてどうぞ) https://puppet.com/resources/whitepaper/2014-state-devops-report
  7. VS. OSパッチ適用地獄 • Immutable Infrastructure にした ◦ AMIバックアップの手間から解放 • マシンイメージのビルドは、

    Pull Request merge 時に自動実行 or 1クリック • Terraform も導入中 [WIP] ◦ 全行程が自動 or 1クリックで完了するように
  8. VS. 障害調査地獄 • モニタリング基盤を新しくつくった ◦ Elasticsearch/Kibana ◦ ここを見れば、サービスの状態が分かる • アラート再設計

    ◦ モニタリングで得られるアウトプットを分類 ▪ ALERTS, TICKETS, LOGGING ◦ 不足している監視項目を新規実装