Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Slack駆動を活かした System Monitoringについて

Slack駆動を活かした System Monitoringについて

Slack駆動を活かしたSystem Monitoringについて

More Decks by Masato Ishigaki / 石垣雅人

Other Decks in Programming

Transcript

  1. © DMM.com labo 10 開発者 API DataStorage Job API DataStorage

    ブラックボックスモニタリング
  2. © DMM.com labo 11 開発者 API DataStorage Job API DataStorage

    ホワイトボックスモニタリング
  3. © DMM.com labo 15 開発者 API DataStorage Job API DataStorage

    Slack駆動 アラート検知もSlack、リリース作業もSlack
  4. © DMM.com labo 16 開発者 API DataStorage Job API DataStorage

    実際にあった稼働率upの成果 ・復旧までの時間が大幅短縮 = 損失も大幅半減 問題発生してからユーザーからの問い合わせがあるまで気づけなかったものが、アラート検知によ り問題発生から調査開始までの時間が削減。 またユーザーからの問い合わせもアバウトなものだったりと、原因調査にも時間がかかっていたの がモニタリングツールにより調査時間削減。 ・障害になる前に対応できる 問題になりそうな箇所の予兆を検知することで、問題発生する前に手を打つことができる。
  5. © DMM.com labo 17 開発者 API DataStorage Job API DataStorage

    Slack駆動 アラート検知もSlack、リリース作業もSlack ユーザーよりも早く問題を検知して、素早く復旧する。 = 障害にさせない 実際にあった稼働率upの成果