Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Slack駆動を活かした System Monitoringについて
Search
Masato Ishigaki / 石垣雅人
January 16, 2018
Programming
0
1.3k
Slack駆動を活かした System Monitoringについて
Slack駆動を活かしたSystem Monitoringについて
Masato Ishigaki / 石垣雅人
January 16, 2018
Tweet
Share
More Decks by Masato Ishigaki / 石垣雅人
See All by Masato Ishigaki / 石垣雅人
開発フェーズだけではない AI導入はどのように進めていくべきか / How should we proceed with AI adoption beyond the development stage?
i35_267
2
160
【Forkwell】「正しく」失敗できるチームを作る──現場のリーダーのための恐怖と不安を乗り越える技術 - FL#83 / A team that can fail correctly by forkwell
i35_267
4
570
【Findy】「正しく」失敗できる チームの作り方 〜リアルな事例から紐解く失敗を恐れない組織とは〜 / A team that can fail correctly by findy
i35_267
7
1.6k
技術負債の「予兆検知」と「状況異変」のススメ / Technology Dept
i35_267
2
1.4k
技術負債による事業の失敗はなぜ起こるのか / Why do business failures due to technical debt occur?
i35_267
5
2.4k
「開発生産性を上げる改善」って儲かるの?に答えられるようにする / Is development productivity profitable?
i35_267
29
21k
「開発生産性」はエンジニア”だけ” のモノではなくなった? / "Development productivity" is no longer just for engineers?
i35_267
11
2.8k
開発生産性の現在地点~エンジニアリングが及ぼす多角的視点 / Current status of development productivity
i35_267
69
27k
開発生産性の低下による、事業の失敗はなぜ起こるのか / ProductivityPitfalls
i35_267
6
1.6k
Other Decks in Programming
See All in Programming
エラーって何種類あるの?
kajitack
5
140
Go1.25からのGOMAXPROCS
kuro_kurorrr
0
180
RubyKaigiで得られる10の価値 〜Ruby話を聞くことだけが RubyKaigiじゃない〜
tomohiko9090
0
140
つよそうにふるまい、つよい成果を出すのなら、つよいのかもしれない
irof
1
280
「ElixirでIoT!!」のこれまでとこれから
takasehideki
0
350
GoのWebAssembly活用パターン紹介
syumai
3
10k
人には人それぞれのサービス層がある
shimabox
3
670
PT AI без купюр
v0lka
0
230
イベントストーミングから始めるドメイン駆動設計
jgeem
4
820
Practical Tips and Tricks for Working with Compose Multiplatform Previews (mDevCamp 2025)
stewemetal
0
120
社内での開発コミュニティ活動とモジュラーモノリス標準化事例のご紹介/xPalette and Introduction of Modular monolith standardization
m4maruyama
0
120
Haskell でアルゴリズムを抽象化する / 関数型言語で競技プログラミング
naoya
17
4.2k
Featured
See All Featured
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
281
13k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3k
How STYLIGHT went responsive
nonsquared
100
5.6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
47
2.8k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.3k
Measuring & Analyzing Core Web Vitals
bluesmoon
7
480
StorybookのUI Testing Handbookを読んだ
zakiyama
30
5.8k
Statistics for Hackers
jakevdp
799
220k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.2k
How to Think Like a Performance Engineer
csswizardry
24
1.7k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
130
Transcript
© DMM.com labo 1 Slack駆動を活かした System Monitoringについて
© DMM.com labo サービスモニタリング概要 2 当チーム管轄システムについて オンプレミス クラウド 開発者 API
DataStorage Job API DataStorage
© DMM.com labo サービスモニタリング概要 モニタリングの定義について ブラックボックスモニタリング あるシステムの外部(例 : ユーザー)からの動作、振る舞い、インターフェイスの状態を見る。 ホワイトボックスモニタリング
あるシステムの内部の状態を見ます。コンピューターリソース (CPU等)の状況、プロセス数、 JMX.... ....
© DMM.com labo 4 ブラックボックスモニタリング 事例 :
© DMM.com labo 5 ブラックボックスモニタリング API API Application Performance Monitoring
© DMM.com labo 6 ブラックボックスモニタリング トランザクション選択 処理の詳細
© DMM.com labo 7 ブラックボックスモニタリング Apdex : ユーザー満足度 スループット エラー件数
ワースト5のトランザクション
© DMM.com labo 8 開発者 API DataStorage Job API DataStorage
Overview of the Monitoring
© DMM.com labo 9 開発者 API DataStorage Job API DataStorage
© DMM.com labo 10 開発者 API DataStorage Job API DataStorage
ブラックボックスモニタリング
© DMM.com labo 11 開発者 API DataStorage Job API DataStorage
ホワイトボックスモニタリング
© DMM.com labo 12 開発者 API DataStorage Job API DataStorage
© DMM.com labo 13 開発者 API DataStorage Job API DataStorage
© DMM.com labo 14 開発者 API DataStorage Job API DataStorage
すべての情報をSlackに集約
© DMM.com labo 15 開発者 API DataStorage Job API DataStorage
Slack駆動 アラート検知もSlack、リリース作業もSlack
© DMM.com labo 16 開発者 API DataStorage Job API DataStorage
実際にあった稼働率upの成果 ・復旧までの時間が大幅短縮 = 損失も大幅半減 問題発生してからユーザーからの問い合わせがあるまで気づけなかったものが、アラート検知によ り問題発生から調査開始までの時間が削減。 またユーザーからの問い合わせもアバウトなものだったりと、原因調査にも時間がかかっていたの がモニタリングツールにより調査時間削減。 ・障害になる前に対応できる 問題になりそうな箇所の予兆を検知することで、問題発生する前に手を打つことができる。
© DMM.com labo 17 開発者 API DataStorage Job API DataStorage
Slack駆動 アラート検知もSlack、リリース作業もSlack ユーザーよりも早く問題を検知して、素早く復旧する。 = 障害にさせない 実際にあった稼働率upの成果
© DMM.com labo すべてを「見える化」すれば何かがわかる。 18 「案件優先度」の見える化 「開発プロセス」の見える化 最後に....
© DMM.com labo ご清聴ありがとうございました。 19