Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Slack駆動を活かした System Monitoringについて
Search
Masato Ishigaki / 石垣雅人
January 16, 2018
Programming
0
1.2k
Slack駆動を活かした System Monitoringについて
Slack駆動を活かしたSystem Monitoringについて
Masato Ishigaki / 石垣雅人
January 16, 2018
Tweet
Share
More Decks by Masato Ishigaki / 石垣雅人
See All by Masato Ishigaki / 石垣雅人
【5分】始める前に失敗する ── fail fast(早く失敗)ではなくfail before(事前検死) ──
i35_267
1
35
技術負債による事業の失敗はなぜ起こるのか / Why do business failures due to technical debt occur?
i35_267
4
1.9k
「開発生産性を上げる改善」って儲かるの?に答えられるようにする / Is development productivity profitable?
i35_267
28
19k
「開発生産性」はエンジニア”だけ” のモノではなくなった? / "Development productivity" is no longer just for engineers?
i35_267
8
2.6k
開発生産性の現在地点~エンジニアリングが及ぼす多角的視点 / Current status of development productivity
i35_267
68
25k
開発生産性の低下による、事業の失敗はなぜ起こるのか / ProductivityPitfalls
i35_267
6
1.5k
開発生産性の多角的接点〜1,000名のクリエイター組織 × 開発生産性〜 / Multifaceted touchpoints of development productivity
i35_267
5
1.6k
内製化で強化させる、事業のスケーラビリティーとエンジニアの成長戦略 / insourcing
i35_267
2
370
見積もりをしない。
i35_267
4
1.2k
Other Decks in Programming
See All in Programming
アクターシステムに頼らずEvent Sourcingする方法について
j5ik2o
4
350
テストコードのガイドライン 〜作成から運用まで〜
riku929hr
5
940
見えないメモリを観測する: PHP 8.4 `pg_result_memory_size()` とSQL結果のメモリ管理
kentaroutakeda
0
720
「とりあえず動く」コードはよい、「読みやすい」コードはもっとよい / Code that 'just works' is good, but code that is 'readable' is even better.
mkmk884
3
750
快速入門可觀測性
blueswen
0
410
Асинхронность неизбежна: как мы проектировали сервис уведомлений
lamodatech
0
970
Kaigi on Railsに初参加したら、その日にLT登壇が決定した件について
tama50505
0
110
ある日突然あなたが管理しているサーバーにDDoSが来たらどうなるでしょう?知ってるようで何も知らなかったDDoS攻撃と対策 #phpcon.2024
akase244
2
400
PHPとAPI Platformで作る本格的なWeb APIアプリケーション(入門編) / phpcon 2024 Intro to API Platform
ttskch
0
300
rails stats で紐解く ANDPAD のイマを支える技術たち
andpad
1
300
CQRS+ES の力を使って効果を感じる / Feel the effects of using the power of CQRS+ES
seike460
PRO
0
160
【re:Growth 2024】 Aurora DSQL をちゃんと話します!
maroon1st
0
800
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Become a Pro
speakerdeck
PRO
26
5k
Building Your Own Lightsaber
phodgson
103
6.1k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
It's Worth the Effort
3n
183
28k
Building Flexible Design Systems
yeseniaperezcruz
327
38k
Building a Scalable Design System with Sketch
lauravandoore
460
33k
GraphQLとの向き合い方2022年版
quramy
44
13k
How to train your dragon (web standard)
notwaldorf
88
5.7k
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
191
16k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
17
2.3k
Transcript
© DMM.com labo 1 Slack駆動を活かした System Monitoringについて
© DMM.com labo サービスモニタリング概要 2 当チーム管轄システムについて オンプレミス クラウド 開発者 API
DataStorage Job API DataStorage
© DMM.com labo サービスモニタリング概要 モニタリングの定義について ブラックボックスモニタリング あるシステムの外部(例 : ユーザー)からの動作、振る舞い、インターフェイスの状態を見る。 ホワイトボックスモニタリング
あるシステムの内部の状態を見ます。コンピューターリソース (CPU等)の状況、プロセス数、 JMX.... ....
© DMM.com labo 4 ブラックボックスモニタリング 事例 :
© DMM.com labo 5 ブラックボックスモニタリング API API Application Performance Monitoring
© DMM.com labo 6 ブラックボックスモニタリング トランザクション選択 処理の詳細
© DMM.com labo 7 ブラックボックスモニタリング Apdex : ユーザー満足度 スループット エラー件数
ワースト5のトランザクション
© DMM.com labo 8 開発者 API DataStorage Job API DataStorage
Overview of the Monitoring
© DMM.com labo 9 開発者 API DataStorage Job API DataStorage
© DMM.com labo 10 開発者 API DataStorage Job API DataStorage
ブラックボックスモニタリング
© DMM.com labo 11 開発者 API DataStorage Job API DataStorage
ホワイトボックスモニタリング
© DMM.com labo 12 開発者 API DataStorage Job API DataStorage
© DMM.com labo 13 開発者 API DataStorage Job API DataStorage
© DMM.com labo 14 開発者 API DataStorage Job API DataStorage
すべての情報をSlackに集約
© DMM.com labo 15 開発者 API DataStorage Job API DataStorage
Slack駆動 アラート検知もSlack、リリース作業もSlack
© DMM.com labo 16 開発者 API DataStorage Job API DataStorage
実際にあった稼働率upの成果 ・復旧までの時間が大幅短縮 = 損失も大幅半減 問題発生してからユーザーからの問い合わせがあるまで気づけなかったものが、アラート検知によ り問題発生から調査開始までの時間が削減。 またユーザーからの問い合わせもアバウトなものだったりと、原因調査にも時間がかかっていたの がモニタリングツールにより調査時間削減。 ・障害になる前に対応できる 問題になりそうな箇所の予兆を検知することで、問題発生する前に手を打つことができる。
© DMM.com labo 17 開発者 API DataStorage Job API DataStorage
Slack駆動 アラート検知もSlack、リリース作業もSlack ユーザーよりも早く問題を検知して、素早く復旧する。 = 障害にさせない 実際にあった稼働率upの成果
© DMM.com labo すべてを「見える化」すれば何かがわかる。 18 「案件優先度」の見える化 「開発プロセス」の見える化 最後に....
© DMM.com labo ご清聴ありがとうございました。 19