Slide 1

Slide 1 text

を支えるインフラ監視 【freee × プレイド】Tech Meetup

Slide 2

Slide 2 text

#plaidtech

Slide 3

Slide 3 text

話すこと ● freee で使っている監視系サービス ● 少人数で運用するためのノウハウ

Slide 4

Slide 4 text

話さないこと ● 監視の基本的なこと ● 各監視サービスの比較や使い方

Slide 5

Slide 5 text

自己紹介 Twitter / GitHub @manabusakai

Slide 6

Slide 6 text

自己紹介 ● 坂井 学(さかい まなぶ) ● 2016 年にインフラエンジニアとして入社 ● Scala / Ruby / PHP を書いてました ● 得意分野は AWS ○ AWS 認定ソリューションアーキテクト - プロフェッショナル ○ AWS 認定 DevOps エンジニア - プロフェッショナル

Slide 7

Slide 7 text

スモールビジネスに携わる方が より創造的な活動にフォーカスできるよう

Slide 8

Slide 8 text

freee が提供するサービス ● 会計 freee ● 給与計算 freee ● 会社設立 freee ● マイナンバー管理 freee ● 開業 freee

Slide 9

Slide 9 text

freee が提供するサービス

Slide 10

Slide 10 text

freee で使っている 監視系サービス

Slide 11

Slide 11 text

● サーバー監視 ○ Mackerel ○ CloudWatch ○ Prometheus ● パフォーマンス監視 ○ New Relic ○ MONyog ● トラッキング ○ Redash ○ Kibana

Slide 12

Slide 12 text

それぞれの守備範囲 AWS サーバ アプリ データベース Mackerel ◯ ◯ ◯ CloudWatch ◯ Prometheus ◯ New Relic ◯ MONyog ◯

Slide 13

Slide 13 text

インフラエンジニアは 何人いますか?

Slide 14

Slide 14 text

3 / 80 人

Slide 15

Slide 15 text

No content

Slide 16

Slide 16 text

1 人あたり 20 万事業所

Slide 17

Slide 17 text

効率化しないと回らない!

Slide 18

Slide 18 text

少人数で運用するために 工夫していること

Slide 19

Slide 19 text

① 情報はプルよりプッシュ 必要な情報は一か所にプッシュされる仕組みを作る。 ● Slack に通知しているもの ○ Mackerel からのアラート ○ GitHub など外部サービスの障害情報 ○ アプリケーションのパフォーマンスサマリー ○ AWS のコスト ○ Qiita:Team の新着記事

Slide 20

Slide 20 text

① 情報はプルよりプッシュ

Slide 21

Slide 21 text

② フルマネージドサービスの活用 AWS のフルマネージドサービスを活用して、 監視するポイントを根本から減らす。 ● トレードオフとの兼ね合い ○ 運用が楽になる ⇔ ブラックボックスが増える ○ ノーメンテナンス ⇔ 障害が起きたら手が出せない ○ 設定が簡単 ⇔ 痒いところに手が届かない

Slide 22

Slide 22 text

③ 障害が起きることを前提に 障害が起きることを前提にインフラを設計する。 ● 例えば ○ サーバは Auto Scaling で管理し可用性を担保する ○ 単一障害点を作り出さない ○ リトライを前提としたコードを書く ○ etc...

Slide 23

Slide 23 text

③ 障害が起きることを前提に “障害を避ける最もよい方法は、 常に障害を起こすことである”

Slide 24

Slide 24 text

④ 本業にフォーカスする サービスをより良くすることにフォーカスする。 それ以外の部分はお金で解決するのもアリ。 ● Zabbix から Mackerel へ移行 ○ 結果的には Mackerel のコストは充分ペイした ○ Mackerel Meetup #8 Tokyo (2016/10/17) で発表 ■ ref. Zabbix から Mackerel へ - Mackerel で実現したコストダウン

Slide 25

Slide 25 text

④ 本業にフォーカスする

Slide 26

Slide 26 text

⑤ トラッキングして見える化 数値をトラッキングして見える化する。 ● 数値は嘘をつかない ○ 曖昧さを排除できる ○ 数値を元に改善サイクルを回す

Slide 27

Slide 27 text

⑤ トラッキングして見える化 様々なメトリクスをトラッ キングして、見える化

Slide 28

Slide 28 text

まとめ

Slide 29

Slide 29 text

まとめ freee はごく普通の監視サービスを使っていますが、 工夫することで少人数を実現しています。 1. 情報はプルよりプッシュ 2. フルマネージドサービスの活用 3. 障害が起きることを前提に 4. 本業にフォーカスする 5. トラッキングして見える化

Slide 30

Slide 30 text

エンジニア募集中

Slide 31

Slide 31 text

最後に宣伝 今年から個人事業主として開業しました。 ● AWS の導入支援 ● AWS アーキテクチャのコンサルティング などをやっています。 興味を持った方は、気軽にお声がけください