Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Slack駆動を活かした System Monitoringについて
Search
Masato Ishigaki / 石垣雅人
January 16, 2018
Programming
0
1.3k
Slack駆動を活かした System Monitoringについて
Slack駆動を活かしたSystem Monitoringについて
Masato Ishigaki / 石垣雅人
January 16, 2018
Tweet
Share
More Decks by Masato Ishigaki / 石垣雅人
See All by Masato Ishigaki / 石垣雅人
「正しく」失敗できる チームの作り方 〜リアルな事例から紐解く失敗を恐れない組織とは〜 / A team that can fail correctly
i35_267
1
510
技術負債の「予兆検知」と「状況異変」のススメ / Technology Dept
i35_267
1
1.1k
技術負債による事業の失敗はなぜ起こるのか / Why do business failures due to technical debt occur?
i35_267
4
2.2k
「開発生産性を上げる改善」って儲かるの?に答えられるようにする / Is development productivity profitable?
i35_267
28
20k
「開発生産性」はエンジニア”だけ” のモノではなくなった? / "Development productivity" is no longer just for engineers?
i35_267
9
2.7k
開発生産性の現在地点~エンジニアリングが及ぼす多角的視点 / Current status of development productivity
i35_267
68
26k
開発生産性の低下による、事業の失敗はなぜ起こるのか / ProductivityPitfalls
i35_267
6
1.5k
開発生産性の多角的接点〜1,000名のクリエイター組織 × 開発生産性〜 / Multifaceted touchpoints of development productivity
i35_267
5
1.6k
内製化で強化させる、事業のスケーラビリティーとエンジニアの成長戦略 / insourcing
i35_267
2
400
Other Decks in Programming
See All in Programming
sappoRo.R #12 初心者セッション
kosugitti
0
260
Formの複雑さに立ち向かう
bmthd
1
890
一休.com のログイン体験を支える技術 〜Web Components x Vue.js 活用事例と最適化について〜
atsumim
0
660
Domain-Driven Transformation
hschwentner
2
1.9k
GitHub Actions × RAGでコードレビューの検証の結果
sho_000
0
280
Introduction to kotlinx.rpc
arawn
0
740
Pythonでもちょっとリッチな見た目のアプリを設計してみる
ueponx
1
590
なぜイベント駆動が必要なのか - CQRS/ESで解く複雑系システムの課題 -
j5ik2o
12
4.4k
昭和の職場からアジャイルの世界へ
kumagoro95
1
400
DRFを少しずつ オニオンアーキテクチャに寄せていく DjangoCongress JP 2025
nealle
2
180
データの整合性を保つ非同期処理アーキテクチャパターン / Async Architecture Patterns
mokuo
53
18k
『テスト書いた方が開発が早いじゃん』を解き明かす #phpcon_nagoya
o0h
PRO
3
1.8k
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
4
350
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
For a Future-Friendly Web
brad_frost
176
9.5k
GraphQLの誤解/rethinking-graphql
sonatard
68
10k
How to Think Like a Performance Engineer
csswizardry
22
1.4k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.5k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
Transcript
© DMM.com labo 1 Slack駆動を活かした System Monitoringについて
© DMM.com labo サービスモニタリング概要 2 当チーム管轄システムについて オンプレミス クラウド 開発者 API
DataStorage Job API DataStorage
© DMM.com labo サービスモニタリング概要 モニタリングの定義について ブラックボックスモニタリング あるシステムの外部(例 : ユーザー)からの動作、振る舞い、インターフェイスの状態を見る。 ホワイトボックスモニタリング
あるシステムの内部の状態を見ます。コンピューターリソース (CPU等)の状況、プロセス数、 JMX.... ....
© DMM.com labo 4 ブラックボックスモニタリング 事例 :
© DMM.com labo 5 ブラックボックスモニタリング API API Application Performance Monitoring
© DMM.com labo 6 ブラックボックスモニタリング トランザクション選択 処理の詳細
© DMM.com labo 7 ブラックボックスモニタリング Apdex : ユーザー満足度 スループット エラー件数
ワースト5のトランザクション
© DMM.com labo 8 開発者 API DataStorage Job API DataStorage
Overview of the Monitoring
© DMM.com labo 9 開発者 API DataStorage Job API DataStorage
© DMM.com labo 10 開発者 API DataStorage Job API DataStorage
ブラックボックスモニタリング
© DMM.com labo 11 開発者 API DataStorage Job API DataStorage
ホワイトボックスモニタリング
© DMM.com labo 12 開発者 API DataStorage Job API DataStorage
© DMM.com labo 13 開発者 API DataStorage Job API DataStorage
© DMM.com labo 14 開発者 API DataStorage Job API DataStorage
すべての情報をSlackに集約
© DMM.com labo 15 開発者 API DataStorage Job API DataStorage
Slack駆動 アラート検知もSlack、リリース作業もSlack
© DMM.com labo 16 開発者 API DataStorage Job API DataStorage
実際にあった稼働率upの成果 ・復旧までの時間が大幅短縮 = 損失も大幅半減 問題発生してからユーザーからの問い合わせがあるまで気づけなかったものが、アラート検知によ り問題発生から調査開始までの時間が削減。 またユーザーからの問い合わせもアバウトなものだったりと、原因調査にも時間がかかっていたの がモニタリングツールにより調査時間削減。 ・障害になる前に対応できる 問題になりそうな箇所の予兆を検知することで、問題発生する前に手を打つことができる。
© DMM.com labo 17 開発者 API DataStorage Job API DataStorage
Slack駆動 アラート検知もSlack、リリース作業もSlack ユーザーよりも早く問題を検知して、素早く復旧する。 = 障害にさせない 実際にあった稼働率upの成果
© DMM.com labo すべてを「見える化」すれば何かがわかる。 18 「案件優先度」の見える化 「開発プロセス」の見える化 最後に....
© DMM.com labo ご清聴ありがとうございました。 19