Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Slack駆動を活かした System Monitoringについて
Search
Masato Ishigaki / 石垣雅人
January 16, 2018
Programming
0
1.3k
Slack駆動を活かした System Monitoringについて
Slack駆動を活かしたSystem Monitoringについて
Masato Ishigaki / 石垣雅人
January 16, 2018
Tweet
Share
More Decks by Masato Ishigaki / 石垣雅人
See All by Masato Ishigaki / 石垣雅人
生成AI活用のROI、どう測る? DMM.com 開発責任者から学ぶ「AI効果検証のノウハウ」 / ROI of AI
i35_267
5
280
大規模組織にAIエージェントを迅速に導入するためのセキュリティの勘所 / AI agents for large-scale organizations
i35_267
7
1.1k
無意味な開発生産性の議論から抜け出すための予兆検知とお金とAI
i35_267
8
21k
Clineを含めたAIエージェントを 大規模組織に導入し、投資対効果を考える / Introducing AI agents into your organization
i35_267
6
2.2k
開発フェーズだけではない AI導入はどのように進めていくべきか / How should we proceed with AI adoption beyond the development stage?
i35_267
4
300
【Forkwell】「正しく」失敗できるチームを作る──現場のリーダーのための恐怖と不安を乗り越える技術 - FL#83 / A team that can fail correctly by forkwell
i35_267
6
680
【Findy】「正しく」失敗できる チームの作り方 〜リアルな事例から紐解く失敗を恐れない組織とは〜 / A team that can fail correctly by findy
i35_267
9
1.8k
技術負債の「予兆検知」と「状況異変」のススメ / Technology Dept
i35_267
2
1.5k
技術負債による事業の失敗はなぜ起こるのか / Why do business failures due to technical debt occur?
i35_267
5
2.7k
Other Decks in Programming
See All in Programming
Migration to Signals, Resource API, and NgRx Signal Store
manfredsteyer
PRO
0
130
CSC509 Lecture 08
javiergs
PRO
0
270
Module Proxyのマニアックな話 / Niche Topics in Module Proxy
kuro_kurorrr
0
140
Blazing Fast UI Development with Compose Hot Reload (Bangladesh KUG, October 2025)
zsmb
2
420
SwiftDataを使って10万件のデータを読み書きする
akidon0000
0
250
Register is more than clipboard
satorunooshie
1
150
Dive into Triton Internals
appleparan
0
260
ビルドプロセスをデバッグしよう!
yt8492
0
130
Vueのバリデーション、結局どれを選べばいい? ― 自作バリデーションの限界と、脱却までの道のり ― / Which Vue Validation Library Should We Really Use? The Limits of Self-Made Validation and How I Finally Moved On
neginasu
3
1.7k
Leading Effective Engineering Teams in the AI Era
addyosmani
7
670
マンガアプリViewerの大画面対応を考える
kk__777
0
420
ネストしたdata classの面倒な更新にさようなら!Lensを作って理解するArrowのOpticsの世界
shiita0903
1
170
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
514
110k
The Pragmatic Product Professional
lauravandoore
36
7k
GraphQLとの向き合い方2022年版
quramy
49
14k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
36
6.1k
A designer walks into a library…
pauljervisheath
209
24k
Bash Introduction
62gerente
615
210k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
253
22k
Agile that works and the tools we love
rasmusluckow
331
21k
Context Engineering - Making Every Token Count
addyosmani
8
320
Building Flexible Design Systems
yeseniaperezcruz
329
39k
Scaling GitHub
holman
463
140k
Transcript
© DMM.com labo 1 Slack駆動を活かした System Monitoringについて
© DMM.com labo サービスモニタリング概要 2 当チーム管轄システムについて オンプレミス クラウド 開発者 API
DataStorage Job API DataStorage
© DMM.com labo サービスモニタリング概要 モニタリングの定義について ブラックボックスモニタリング あるシステムの外部(例 : ユーザー)からの動作、振る舞い、インターフェイスの状態を見る。 ホワイトボックスモニタリング
あるシステムの内部の状態を見ます。コンピューターリソース (CPU等)の状況、プロセス数、 JMX.... ....
© DMM.com labo 4 ブラックボックスモニタリング 事例 :
© DMM.com labo 5 ブラックボックスモニタリング API API Application Performance Monitoring
© DMM.com labo 6 ブラックボックスモニタリング トランザクション選択 処理の詳細
© DMM.com labo 7 ブラックボックスモニタリング Apdex : ユーザー満足度 スループット エラー件数
ワースト5のトランザクション
© DMM.com labo 8 開発者 API DataStorage Job API DataStorage
Overview of the Monitoring
© DMM.com labo 9 開発者 API DataStorage Job API DataStorage
© DMM.com labo 10 開発者 API DataStorage Job API DataStorage
ブラックボックスモニタリング
© DMM.com labo 11 開発者 API DataStorage Job API DataStorage
ホワイトボックスモニタリング
© DMM.com labo 12 開発者 API DataStorage Job API DataStorage
© DMM.com labo 13 開発者 API DataStorage Job API DataStorage
© DMM.com labo 14 開発者 API DataStorage Job API DataStorage
すべての情報をSlackに集約
© DMM.com labo 15 開発者 API DataStorage Job API DataStorage
Slack駆動 アラート検知もSlack、リリース作業もSlack
© DMM.com labo 16 開発者 API DataStorage Job API DataStorage
実際にあった稼働率upの成果 ・復旧までの時間が大幅短縮 = 損失も大幅半減 問題発生してからユーザーからの問い合わせがあるまで気づけなかったものが、アラート検知によ り問題発生から調査開始までの時間が削減。 またユーザーからの問い合わせもアバウトなものだったりと、原因調査にも時間がかかっていたの がモニタリングツールにより調査時間削減。 ・障害になる前に対応できる 問題になりそうな箇所の予兆を検知することで、問題発生する前に手を打つことができる。
© DMM.com labo 17 開発者 API DataStorage Job API DataStorage
Slack駆動 アラート検知もSlack、リリース作業もSlack ユーザーよりも早く問題を検知して、素早く復旧する。 = 障害にさせない 実際にあった稼働率upの成果
© DMM.com labo すべてを「見える化」すれば何かがわかる。 18 「案件優先度」の見える化 「開発プロセス」の見える化 最後に....
© DMM.com labo ご清聴ありがとうございました。 19