Zabbix から Mackerel へ #mackerelio / zabbix-to-mackerel

Zabbix から Mackerel へ #mackerelio / zabbix-to-mackerel

Mackerel Meetup #8 Tokyo の発表スライドです。

Dacd98e0fcfc478b24f9cd7ec9208904?s=128

Manabu Sakai

October 17, 2016
Tweet

Transcript

  1. Zabbix から Mackerel へ Mackerel で実現したコストダウン Mackerel Meetup #8 Tokyo

  2. 本日のハッシュタグ #mackerelio

  3. 今日お話しすること • Zabbix から Mackerel へ移行した経緯 • Mackerel の導入で得られたメリット 最後の

    5 分で質疑応答を受け付けます。
  4. スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう

  5. freee のご紹介 スモールビジネスの バックオフィス業務を “圧倒的に効率化” するサービスを提供。

  6. freee が提供するサービス • 会計 freee • 給与計算 freee • 会社設立

    freee • マイナンバー管理 freee • 開業 freee 10/10 release!
  7. 自己紹介 Twitter / GitHub @manabusakai

  8. 自己紹介 • 2016 年 5 月 freee に入社 • 開発者よりのインフラエンジニア

    ◦ Scala, Ruby での開発や AWS が得意分野
  9. None
  10. None
  11. 会場の皆さまに質問です

  12. 会場アンケート 当てはまる方は挙手をお願いします。 • インフラエンジニアの方 • 監視ツールに Zabbix を使っている方 • Zabbix

    に不満を持っている方 • 監視ツールにワクワクしている方
  13. None
  14. 移行スケジュール • 7 月上旬:検証開始 • 7 月下旬:本契約 • 10 月:移行完了

    2 〜 3 か月あれば充分移行できます
  15. なぜ Zabbix から 移行したのか?

  16. Zabbix で起きていた 3 つの問題点 1. Zabbix 自体の運用コストが高い 2. クラウドの監視に向いていない 3.

    開発者が活用できていない
  17. ① Zabbix 自体の運用コストが高い Zabbix を安定運用させるには手間がかかる。 • MySQL チューニング • IOPS

    チューニング (RAID, LVM, etc) • Housekeeper の負荷との戦い • 監視項目の追加が面倒くさい • Zabbix サーバのバージョンアップ Zabbix おじさん…
  18. ② クラウドの監視に向いていない • Auto Scaling を導入したことで、個々ではなく全体の傾向を見 る必要が出てきた ◦ Zabbix で全体の傾向を見るのは工夫が必要

    • VPC 毎に Zabbix サーバを立てる必要がある
  19. ③ 開発者が活用できていない • UI が使いにくいため、一部の開発者にしか利用されていな かった • 監視ツールはインフラチームだけが見ればいいもの?

  20. 【参考】他の監視ツールも検討 コスト 移行 運用 使いやすさ Zabbix 3.0 ◯ ◎ △

    × Sensu ◯ × △ △ Prometheus ◯ × × △ Mackerel △ ◎ ◎ ◎
  21. Mackerel に移行して どうだったか?

  22. ① 全体の傾向を把握できるように • Mackerel のロール機能を活用 ◦ 役割単位で全体の傾向が把握できるようになった 台数が増減しても 全体の傾向がわかる

  23. 【実例】メモリリークを早期に検知 とあるロールでメモリリークが発生。全体の傾向が見ただけでパッ と掴めた。 デプロイ直後から 傾向が急変してる

  24. 【ワンポイント】 EC2 タグを活用 AWS CLI を使って EC2 タグを取得し、サービスとロールを mackerel-agent の起動オプションに追加。

    mackerel-agent -role=<service>:<role> EC2 タグから取得。 起動すれば自動的に ロールに追加される!
  25. ② AWS のコストダウンを実現 • ロールごとに適正な台数が把握できた • Auto Scaling で台数を調整しコストダウンを実現 ◦

    約 5 〜 10% 削減 • Mackerel のコストは充分ペイした
  26. 【ワンポイント】 Slack 通知を活用 working になっていないホストや AWS のコストを Slack に通知 し、手間なく情報を得られるようにした。

  27. ③ 進化し続ける監視ツール • Mackerel は毎週アップデートされる監視ツール • Webhook や REST API、mkr

    コマンドなど 一般的な Web 技術を使って簡単にハックできる
  28. ウソじゃない!

  29. まとめ Mackerel を導入したことで、 • 監視ツールを運用するという人的コストがゼロに • 適切なサーバ台数を知ることで無駄を省きコストダウンにつな がった ※ 導入してからまだ日が浅いので、開発者が活用するようになったかは次の機会にご紹介します。

  30. うまい話ばかりだと 胡散くさいので…

  31. 改善してもらいたい点 1. グラフの描画が重い ◦ 動的に読み込むのでどうしても時間がかかる 2. AWS インテグレーションの充実 ◦ 対応しているのは

    EC2, ELB, RDS, ElastiCache ◦ Redshift や SQS もお願いします!
  32. エンジニア募集中! 「freee 採用」で検索!

  33. スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう