Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Zabbix から Mackerel へ #mackerelio / zabbix-to-ma...
Search
Manabu Sakai
October 17, 2016
Technology
10
26k
Zabbix から Mackerel へ #mackerelio / zabbix-to-mackerel
Mackerel Meetup #8 Tokyo の発表スライドです。
Manabu Sakai
October 17, 2016
Tweet
Share
More Decks by Manabu Sakai
See All by Manabu Sakai
アウトプットが切り拓いた自分のエンジニア人生 / Infra Study 2nd #8
manabusakai
0
25k
GitHub Actions の self-hosted runner と Amazon EKS を使った Docker のビルドパイプライン / secure-docker-build-pipeline
manabusakai
0
2k
SaaS における EKS のシングルテナントクラスタ戦略とスポットインスタンス活用術 / EKS single-tenant cluster strategy and Spot Instances
manabusakai
0
6.9k
freee のエンジニアは障害から何を学び、どう改善しているのか? / What do freee engineers learn and improve from failures?
manabusakai
8
19k
我々は Kubernetes の何を監視すればいいのか? / CloudNative Days Kansai 2019
manabusakai
24
8.5k
CI/CD パイプラインを最速で組み立てるための 4 つのポイント / Four points to assemble the CI CD pipeline fastest
manabusakai
9
3.6k
Kubernetes を使ってエンジニア組織の生産性を上げよう / kubernetes-and-engineer-productivity
manabusakai
3
7.1k
freee のマイクロサービスを K8s + Go で組む! 短期プロジェクト成功の記録 / microservices-using-k8s-and-go
manabusakai
4
10k
Kubernetes 入門者が 3 か月で本番導入するためにやったこと / kubernetes-beginner
manabusakai
7
14k
Other Decks in Technology
See All in Technology
CAMERA-Suite: 広告文生成のための評価スイート / ai-camera-suite
cyberagentdevelopers
PRO
3
230
Mackerelが取り組むオブザーバビリティ - Mackerel Tech Day
mackerelio
0
330
とあるユーザー企業におけるリスクベースで考えるセキュリティ業務のお話し
4su_para
0
250
AIを使って小説を書こう!【2024/10/25講演資料】
kamomeashizawa
0
160
dbt-coreで実現するCore DataMartsのデータモデリング〜dbt編〜 / Core DataMarts Modeling with dbt-core
i125
3
1.2k
LLMアプリをRagasで評価して、Langfuseで可視化しよう!
minorun365
PRO
2
230
生成AIの強みと弱みを理解して、生成AIがもたらすパワーをプロダクトの価値へ繋げるために実践したこと / advance-ai-generating
cyberagentdevelopers
PRO
0
120
急成長中のWINTICKETにおける品質と開発スピードと向き合ったQA戦略と今後の展望 / winticket-autify
cyberagentdevelopers
PRO
1
120
Capybara+生成AIでどこまで本当に自然言語のテストを書けるか?
yusukeiwaki
6
1.1k
30万人が利用するチャットをFirebase Realtime DatabaseからActionCableへ移行する方法
ryosk7
2
300
APIテスト自動化の勘所
yokawasa
4
1.1k
リファクタリングへの耐性が高いモデルベースの統合テストの紹介 / Model-Base Integration Test for Refactoring
yuitosato
5
1.5k
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9k
Visualization
eitanlees
143
15k
The Invisible Side of Design
smashingmag
297
50k
Docker and Python
trallard
40
3k
How to Ace a Technical Interview
jacobian
275
23k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
355
29k
Designing Experiences People Love
moore
138
23k
RailsConf 2023
tenderlove
29
870
Building Adaptive Systems
keathley
38
2.2k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Six Lessons from altMBA
skipperchong
26
3.4k
YesSQL, Process and Tooling at Scale
rocio
167
14k
Transcript
Zabbix から Mackerel へ Mackerel で実現したコストダウン Mackerel Meetup #8 Tokyo
本日のハッシュタグ #mackerelio
今日お話しすること • Zabbix から Mackerel へ移行した経緯 • Mackerel の導入で得られたメリット 最後の
5 分で質疑応答を受け付けます。
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう
freee のご紹介 スモールビジネスの バックオフィス業務を “圧倒的に効率化” するサービスを提供。
freee が提供するサービス • 会計 freee • 給与計算 freee • 会社設立
freee • マイナンバー管理 freee • 開業 freee 10/10 release!
自己紹介 Twitter / GitHub @manabusakai
自己紹介 • 2016 年 5 月 freee に入社 • 開発者よりのインフラエンジニア
◦ Scala, Ruby での開発や AWS が得意分野
None
None
会場の皆さまに質問です
会場アンケート 当てはまる方は挙手をお願いします。 • インフラエンジニアの方 • 監視ツールに Zabbix を使っている方 • Zabbix
に不満を持っている方 • 監視ツールにワクワクしている方
None
移行スケジュール • 7 月上旬:検証開始 • 7 月下旬:本契約 • 10 月:移行完了
2 〜 3 か月あれば充分移行できます
なぜ Zabbix から 移行したのか?
Zabbix で起きていた 3 つの問題点 1. Zabbix 自体の運用コストが高い 2. クラウドの監視に向いていない 3.
開発者が活用できていない
① Zabbix 自体の運用コストが高い Zabbix を安定運用させるには手間がかかる。 • MySQL チューニング • IOPS
チューニング (RAID, LVM, etc) • Housekeeper の負荷との戦い • 監視項目の追加が面倒くさい • Zabbix サーバのバージョンアップ Zabbix おじさん…
② クラウドの監視に向いていない • Auto Scaling を導入したことで、個々ではなく全体の傾向を見 る必要が出てきた ◦ Zabbix で全体の傾向を見るのは工夫が必要
• VPC 毎に Zabbix サーバを立てる必要がある
③ 開発者が活用できていない • UI が使いにくいため、一部の開発者にしか利用されていな かった • 監視ツールはインフラチームだけが見ればいいもの?
【参考】他の監視ツールも検討 コスト 移行 運用 使いやすさ Zabbix 3.0 ◯ ◎ △
× Sensu ◯ × △ △ Prometheus ◯ × × △ Mackerel △ ◎ ◎ ◎
Mackerel に移行して どうだったか?
① 全体の傾向を把握できるように • Mackerel のロール機能を活用 ◦ 役割単位で全体の傾向が把握できるようになった 台数が増減しても 全体の傾向がわかる
【実例】メモリリークを早期に検知 とあるロールでメモリリークが発生。全体の傾向が見ただけでパッ と掴めた。 デプロイ直後から 傾向が急変してる
【ワンポイント】 EC2 タグを活用 AWS CLI を使って EC2 タグを取得し、サービスとロールを mackerel-agent の起動オプションに追加。
mackerel-agent -role=<service>:<role> EC2 タグから取得。 起動すれば自動的に ロールに追加される!
② AWS のコストダウンを実現 • ロールごとに適正な台数が把握できた • Auto Scaling で台数を調整しコストダウンを実現 ◦
約 5 〜 10% 削減 • Mackerel のコストは充分ペイした
【ワンポイント】 Slack 通知を活用 working になっていないホストや AWS のコストを Slack に通知 し、手間なく情報を得られるようにした。
③ 進化し続ける監視ツール • Mackerel は毎週アップデートされる監視ツール • Webhook や REST API、mkr
コマンドなど 一般的な Web 技術を使って簡単にハックできる
ウソじゃない!
まとめ Mackerel を導入したことで、 • 監視ツールを運用するという人的コストがゼロに • 適切なサーバ台数を知ることで無駄を省きコストダウンにつな がった ※ 導入してからまだ日が浅いので、開発者が活用するようになったかは次の機会にご紹介します。
うまい話ばかりだと 胡散くさいので…
改善してもらいたい点 1. グラフの描画が重い ◦ 動的に読み込むのでどうしても時間がかかる 2. AWS インテグレーションの充実 ◦ 対応しているのは
EC2, ELB, RDS, ElastiCache ◦ Redshift や SQS もお願いします!
エンジニア募集中! 「freee 採用」で検索!
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう