Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Zabbix から Mackerel へ #mackerelio / zabbix-to-ma...
Search
Manabu Sakai
October 17, 2016
Technology
10
27k
Zabbix から Mackerel へ #mackerelio / zabbix-to-mackerel
Mackerel Meetup #8 Tokyo の発表スライドです。
Manabu Sakai
October 17, 2016
Tweet
Share
More Decks by Manabu Sakai
See All by Manabu Sakai
アウトプットが切り拓いた自分のエンジニア人生 / Infra Study 2nd #8
manabusakai
0
26k
GitHub Actions の self-hosted runner と Amazon EKS を使った Docker のビルドパイプライン / secure-docker-build-pipeline
manabusakai
0
2.1k
SaaS における EKS のシングルテナントクラスタ戦略とスポットインスタンス活用術 / EKS single-tenant cluster strategy and Spot Instances
manabusakai
0
7k
freee のエンジニアは障害から何を学び、どう改善しているのか? / What do freee engineers learn and improve from failures?
manabusakai
8
19k
我々は Kubernetes の何を監視すればいいのか? / CloudNative Days Kansai 2019
manabusakai
24
8.5k
CI/CD パイプラインを最速で組み立てるための 4 つのポイント / Four points to assemble the CI CD pipeline fastest
manabusakai
9
3.7k
Kubernetes を使ってエンジニア組織の生産性を上げよう / kubernetes-and-engineer-productivity
manabusakai
3
7.2k
freee のマイクロサービスを K8s + Go で組む! 短期プロジェクト成功の記録 / microservices-using-k8s-and-go
manabusakai
4
10k
Kubernetes 入門者が 3 か月で本番導入するためにやったこと / kubernetes-beginner
manabusakai
7
14k
Other Decks in Technology
See All in Technology
C++26 エラー性動作
faithandbrave
2
670
alecthomas/kong はいいぞ / kamakura.go#7
fujiwara3
1
300
【re:Invent 2024 アプデ】 Prompt Routing の紹介
champ
0
140
20241220_S3 tablesの使い方を検証してみた
handy
3
200
大幅アップデートされたRagas v0.2をキャッチアップ
os1ma
2
520
Turing × atmaCup #18 - 1st Place Solution
hakubishin3
0
470
NW-JAWS #14 re:Invent 2024(予選落ち含)で 発表された推しアップデートについて
nagisa53
0
250
非機能品質を作り込むための実践アーキテクチャ
knih
2
660
社外コミュニティで学び社内に活かす共に学ぶプロジェクトの実践/backlogworld2024
nishiuma
0
250
Postman と API セキュリティ / Postman and API Security
yokawasa
0
200
バクラクのドキュメント解析技術と実データにおける課題 / layerx-ccc-winter-2024
shimacos
2
1k
ゼロから創る横断SREチーム 挑戦と進化の軌跡
rvirus0817
2
260
Featured
See All Featured
Faster Mobile Websites
deanohume
305
30k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
132
33k
How to Think Like a Performance Engineer
csswizardry
22
1.2k
Building Better People: How to give real-time feedback that sticks.
wjessup
365
19k
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
5
440
Automating Front-end Workflow
addyosmani
1366
200k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
95
17k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
665
120k
Navigating Team Friction
lara
183
15k
Transcript
Zabbix から Mackerel へ Mackerel で実現したコストダウン Mackerel Meetup #8 Tokyo
本日のハッシュタグ #mackerelio
今日お話しすること • Zabbix から Mackerel へ移行した経緯 • Mackerel の導入で得られたメリット 最後の
5 分で質疑応答を受け付けます。
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう
freee のご紹介 スモールビジネスの バックオフィス業務を “圧倒的に効率化” するサービスを提供。
freee が提供するサービス • 会計 freee • 給与計算 freee • 会社設立
freee • マイナンバー管理 freee • 開業 freee 10/10 release!
自己紹介 Twitter / GitHub @manabusakai
自己紹介 • 2016 年 5 月 freee に入社 • 開発者よりのインフラエンジニア
◦ Scala, Ruby での開発や AWS が得意分野
None
None
会場の皆さまに質問です
会場アンケート 当てはまる方は挙手をお願いします。 • インフラエンジニアの方 • 監視ツールに Zabbix を使っている方 • Zabbix
に不満を持っている方 • 監視ツールにワクワクしている方
None
移行スケジュール • 7 月上旬:検証開始 • 7 月下旬:本契約 • 10 月:移行完了
2 〜 3 か月あれば充分移行できます
なぜ Zabbix から 移行したのか?
Zabbix で起きていた 3 つの問題点 1. Zabbix 自体の運用コストが高い 2. クラウドの監視に向いていない 3.
開発者が活用できていない
① Zabbix 自体の運用コストが高い Zabbix を安定運用させるには手間がかかる。 • MySQL チューニング • IOPS
チューニング (RAID, LVM, etc) • Housekeeper の負荷との戦い • 監視項目の追加が面倒くさい • Zabbix サーバのバージョンアップ Zabbix おじさん…
② クラウドの監視に向いていない • Auto Scaling を導入したことで、個々ではなく全体の傾向を見 る必要が出てきた ◦ Zabbix で全体の傾向を見るのは工夫が必要
• VPC 毎に Zabbix サーバを立てる必要がある
③ 開発者が活用できていない • UI が使いにくいため、一部の開発者にしか利用されていな かった • 監視ツールはインフラチームだけが見ればいいもの?
【参考】他の監視ツールも検討 コスト 移行 運用 使いやすさ Zabbix 3.0 ◯ ◎ △
× Sensu ◯ × △ △ Prometheus ◯ × × △ Mackerel △ ◎ ◎ ◎
Mackerel に移行して どうだったか?
① 全体の傾向を把握できるように • Mackerel のロール機能を活用 ◦ 役割単位で全体の傾向が把握できるようになった 台数が増減しても 全体の傾向がわかる
【実例】メモリリークを早期に検知 とあるロールでメモリリークが発生。全体の傾向が見ただけでパッ と掴めた。 デプロイ直後から 傾向が急変してる
【ワンポイント】 EC2 タグを活用 AWS CLI を使って EC2 タグを取得し、サービスとロールを mackerel-agent の起動オプションに追加。
mackerel-agent -role=<service>:<role> EC2 タグから取得。 起動すれば自動的に ロールに追加される!
② AWS のコストダウンを実現 • ロールごとに適正な台数が把握できた • Auto Scaling で台数を調整しコストダウンを実現 ◦
約 5 〜 10% 削減 • Mackerel のコストは充分ペイした
【ワンポイント】 Slack 通知を活用 working になっていないホストや AWS のコストを Slack に通知 し、手間なく情報を得られるようにした。
③ 進化し続ける監視ツール • Mackerel は毎週アップデートされる監視ツール • Webhook や REST API、mkr
コマンドなど 一般的な Web 技術を使って簡単にハックできる
ウソじゃない!
まとめ Mackerel を導入したことで、 • 監視ツールを運用するという人的コストがゼロに • 適切なサーバ台数を知ることで無駄を省きコストダウンにつな がった ※ 導入してからまだ日が浅いので、開発者が活用するようになったかは次の機会にご紹介します。
うまい話ばかりだと 胡散くさいので…
改善してもらいたい点 1. グラフの描画が重い ◦ 動的に読み込むのでどうしても時間がかかる 2. AWS インテグレーションの充実 ◦ 対応しているのは
EC2, ELB, RDS, ElastiCache ◦ Redshift や SQS もお願いします!
エンジニア募集中! 「freee 採用」で検索!
スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう