Upgrade to Pro — share decks privately, control downloads, hide ads and more …

タップルでSLOを導入した話 /tapple-slo

Antonio V
September 28, 2018

タップルでSLOを導入した話 /tapple-slo

マッチングサービス開発の裏側Nightで発表したスライドです!
コメントがあれば遠慮なくtwitterにも声かけてください ^^

https://diverse.connpass.com/event/100488/

Antonio V

September 28, 2018
Tweet

More Decks by Antonio V

Other Decks in Technology

Transcript

  1. PROFILE VALVERDE SALMERON ANTONIO • 2013/11 ~ サイバーエージェント • 2015/12

    ~ マッチングエージェント Currently working as SRE @tokageroro @toniov
  2. 導⼊入について サーバー側のメトリックスから始めた SLI Type SLO APIレスポンスタイム Latency 9?% requests <

    ?ms APIレスポンスタイム Latency 99.?% requests < ?ms API成功率 Availability 99.?% メンテ率 Availability 99.?%
  3. 導⼊入について ‣ Time window → 1週間 ‣ 監視 → Kibana

    & DatadogのDashboardとScreenboard ‣ アラート → Datadogで設定して、Slackに流す ‣ Error Budget → 検討中
  4. 参考 ▸ Site Reliability Engineering ➡ Betsy Beyer, Chris Jones,

    Jennifer Petoff and Niall Richard Murphy ▸ The Site Reliability Workbook ➡ Betsy Beyer, Niall Richard Murphy, David K. Rensin, Kent Kawahara and Stephen Thorne