Upgrade to Pro — share decks privately, control downloads, hide ads and more …

エラーバジェット、どう運用していますか?/ Error budget practice

エラーバジェット、どう運用していますか?/ Error budget practice

SRE Lounge #13 登壇資料

開発速度と信頼性のバランスを取るためのエラーバジェット。これが枯渇した場合にSREと関係者はどのように行動することとしているか、その考え方や取り組みの事例についてお話しします。

https://sre-lounge.connpass.com/event/227250/

shonansurvivors

November 19, 2021
Tweet

More Decks by shonansurvivors

Other Decks in Technology

Transcript

  1. 山原 崇史 (やまはら たかし) 所属 株式会社ビズリーチ(Visionalグループ) HRMOSプロダクト本部 RSプロダクト部 Site Reliability

    Engineeringグループ 経歴 SIer・銀行・Web系等を経て、2021年2月に株式会社ビズリーチ入社 自己紹介 @shonansurvivors
  2. ◦ リリースを一時的に停止する/リリース速度を下げる ◦ システムの弾力性を増す/パフォーマンスを改善する ◦ テストや開発へのリソース投資を追加する (p37〜p38から抜粋・要約) 2017 Besty Beyer,

    Chris Jones, Jennifer Petoff, Niall Richard Murphy「Site Reliability Engineering」O’REILLY • 開発速度よりも信頼性を優先し、上記のような行動を取る ◦ なお、枯渇してからではなく、枯渇しそうになった段階で上記に準じた 行動を取り始めても良い エラーバジェットが枯渇したら?