Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
監視ツールをリプレースした時の話
Search
Shuma
April 16, 2024
Business
0
260
監視ツールをリプレースした時の話
Shuma
April 16, 2024
Tweet
Share
More Decks by Shuma
See All by Shuma
Ansible で Vector を導入し Slack 通知とログレベル色分けまでした話
shubox
0
26
阿部寛のホームページをSRE観点で改善出来るか考えてみた。
shubox
0
91
一日の終わりに、晩酌しながら眺めたいシステムログの世界
shubox
0
87
プロダクトがクローズした話
shubox
0
33
今も熱いもの!魂を揺さぶる戦士の儀式:マオリ族のハカ
shubox
0
250
信頼性工学とは? ~カツオを題材に~
shubox
0
100
バージョン管理と人生設計の類似点ver2 -リポジトリから学ぶ生きるヒント-
shubox
0
290
バージョン管理と人生設計の類似点
shubox
0
130
今年を振り返り、来年の抱負
shubox
0
280
Other Decks in Business
See All in Business
なぜ、あのPdMは「時間がない」と言わないのか? ~元エンジニアPdMが実践する「ドキュメント化 x MCP」の全貌~
sam8helloworld
0
150
フルカイテン株式会社 採用資料
fullkaiten
0
80k
AIを使ってライティングを楽に!MCP Serverの活用
hebiko
0
270
株式会社夜明け会社概要資料2025.ver
tomoyuki1188
PRO
0
270
【ニトエル株式会社】会社紹介資料
hr_nitoel
0
180
AI Transformation(AX) カンパニー紹介資料
algomatic
PRO
0
2.1k
続・もっと!「契約交渉よりも顧客との協調を」 〜成果報酬型やってみた結果とその先の挑戦〜
sasakendayo
0
840
VISASQ: ABOUT DEV TEAM
eikohashiba
6
40k
対立を超えてビジネス、開発、顧客が本当に欲しかったものを全両立するプロダクト組織の作り方/trade-off basic rsgt2026
moriyuya
1
1.6k
(8枚)営業プロセス、パイプライン、予材管理、カスタマージャーニーの基本
nyattx
PRO
0
150
【新卒採用資料】Natee Company Deck _202512
nateehr
0
1.5k
株式会社スマートラウンド 会社紹介資料 / CompanyDeck
smartround
0
1.5k
Featured
See All Featured
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
230
First, design no harm
axbom
PRO
1
1.1k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
100
Joys of Absence: A Defence of Solitary Play
codingconduct
1
270
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Designing for Timeless Needs
cassininazir
0
110
How to make the Groovebox
asonas
2
1.9k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.3k
Building Adaptive Systems
keathley
44
2.9k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
730
Transcript
監視ツールをリプレースした時の話 Shuma
内容 01_自己紹介 02_監視ツールとは 03_リプレイスした理由 04_実際の作業 05_一連の作業を通しての良かったこと、課題に感じた点 06_最後に
自己紹介 名前: Shuma 現職:大阪のベンチャー企業でインフラエンジニア エンジニア三年目です。(情シスもやってます。) 技術:AWS、GCP、(他インフラにかかわるもの) 経歴:外食企業で正社員→アルバイト→インフラエンジニア
監視ツールとは サーバーの稼働率やリソースの使用率やネットワークのトラフィックやレスポンスタイム、アプリケーションのパ フォーマンスやエラーなど、様々な項目を監視するもの 代表的なもの Zabbix Prometheus Nagios datadog
リプレースした理由 リプレースした理由として、 ・組織の中での属人化の作業を解消していくため ・事業が大きくなるにつれ、開発組織自体で対応しない といけない作業が増えたため ・監視ツールを使用したインシデント対応フローができて いなかったため。
以前の監視ツールの構成と問題点 リプレースする以前に使用していた監視ツール ・Zabbix (主にサーバ関係) ・CloudWatch (RDSやDynamoDB) 監視内容 CPUやリソース監視や RDSのコネクションを数値とコネクション数 その他にはシステムログや Cron関連のログ インフラ側で実装して運用していたが、なぁなぁの状態だった。
・問題点の把握 開発側と何回も会議し、開発側でインシデントが起きた時 に困っていることや問題点の把握 (例) インフラ側で把握できる監視項目はあったが、 開発側ではアプリケーション関連のログとかAPIのログ関連がすくに 可視化して閲覧できるものがなかった。 実際に問題起きたときは、その選任のひとの頭の中にしか解決方 法がなかった。 実際の作業①
・監視ツールの選定や構成図作成 会議で出た内容をもとにもっとも適しているツールの調査 や検証、 自社サービスのシステムとマッチングしているか確認した うえでの構成図の作成 実際の作業②
・期限を決め、開発側から逐一フィードバックをもらう。 週次や月次で期限を決め、作業の進捗状況を開発側に 共有する。 フィードバックをもらってブラッシュアップする。 実際の作業③
・期限を決め、開発側から逐一フィードバックをもらう。 週次や月次で期限を決め、作業の進捗状況を開発側に 共有する。 フィードバックをもらってブラッシュアップする。 実際の作業③
リプレース後、使用が決定したツール ・CloudWatchに(アラート内容を一元化) →Zabbixは廃止しました。 そして可視化し、情報を集約し見やすくするために ・Grafanaを使用 監視内容 CPUやリソース監視やDBの監視 アプリケーション関連のログ(PHPやPython) Cronの実行ログ サイト監視(https)
リプレース後の選定したツールと構成
・良かったこと お互いの視点に立っての監視内容の把握がより分か りやすくなり、知識の共有ができた。 それに伴い、属人化しつつあった部分が 少しずつ標準化していっている。 一連の作業を通しての良かったこと、課題に感じた点
・課題に感じた点 すべての要望に答えられなかったこと ネットに載っている構成図や監視ツールが自社のサー ビスにマッチングしているかを把握し検証して実装する のにたくさんの工数を割いた。 一連の作業を通しての良かったこと、課題に感じた点
最後に 実際にリプレースをしたから、終わりではなく。 改善点がいくつものあり、今でもブラッシュアップしてます。 ただ、所属している会社の開発組織が大きい組織ではない場合 密接にコミュニケーションをとりながら作業していくと いざ、インシデントは発生したときの対応に監視ツールは非常に 役立ちます。 属人化かではなく、標準化を目指そうとしている方に参考になれば幸いで す。
おわり