Slide 1

Slide 1 text

- vol. 2 - 監視についてみんなに知って欲しいこと えが(@ega4432)

Slide 2

Slide 2 text

アジェンダ 1. はじめに 2. 前回のおさらい 3. 監視のデザインパターン 4. ビジネス KPI 5. 各コンポーネントの監視 6. まとめ 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 2

Slide 3

Slide 3 text

監視についてみんなに知って欲しいこと はじめに 2021 ©︎ ega4432 - Built with marp. 3

Slide 4

Slide 4 text

今回取り扱う書籍 対象読者 監視の基本を理解したい人 実践的かつ実用的な例、アドバイスを知りたい人 前回の話 導入編: https://speakerdeck.com/ega4432/introductory- monitoring 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 4

Slide 5

Slide 5 text

監視についてみんなに知って欲しいこと 今日伝えたいこと 2021 ©︎ ega4432 - Built with marp. 5

Slide 6

Slide 6 text

監視についてみんなに知って欲しいこと 開発に携わる " 全員が " 監視に責任を持ちましょう! 2021 ©︎ ega4432 - Built with marp. 6

Slide 7

Slide 7 text

監視についてみんなに知って欲しいこと 監視のアンチパターン 2021 ©︎ ega4432 - Built with marp. 7

Slide 8

Slide 8 text

監視のアンチパターン 1. ツール依存 2. 役割としての監視 3. チェックボックス監視 4. 監視を頼りにする 5. 手動設定 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 8

Slide 9

Slide 9 text

1. ツール依存 ツール駆動なチーム ツールを増やすのを恐れる 「ツール統合」の名の下に 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 9

Slide 10

Slide 10 text

1. ツール依存 ツールは賢く、注意深く選ぼう ツール駆動なチーム → ミッション駆動なチーム ツールを増やすのを恐れる → 複数のツールを組み合わせる 「ツール統合」の名の下に → 目的に応じた専門家されたツール 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 10

Slide 11

Slide 11 text

2. 役割としての監視 監視とは 役割 → スキル 独立した仕組み → サービスのパフォーマンスを知る重要指標 1 人に監視の全責任を押し付けるチームや会社はアンチパターン 全員が監視について責任を持つ! 監視をするまで本番環境とは言えない! 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 11

Slide 12

Slide 12 text

3. チェックボックス監視 監視が、「これをチェックしていますよ」と誰かに言うためだけのも のになってしまっていること あるあるな状態 CPU, メモリなどのメトリクスは記録しているものの、なぜシステ ムが落ちたのか分からない 誤検知が多い メトリクスを 5 分ごとあるいはそれ以上の間隔で取得 メトリクスの履歴を保存していない 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 12

Slide 13

Slide 13 text

3. チェックボックス監視 解決策 「動いている」状態を定義して、それを監視する OS のメトリクスでのアラートは行わない メトリクスを高頻度で取得する(最低でも 1 分ごと) 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 13

Slide 14

Slide 14 text

4. 監視を頼りにする 監視項目をどんどん増やす 根本的な問題の修正 サービスをより回復性のあるものに 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 14

Slide 15

Slide 15 text

5. 手動設定 監視項目の追加、解除は自動化しよう 自動化できないなら何か重要なことを見落としている可能性がある 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 15

Slide 16

Slide 16 text

監視についてみんなに知って欲しいこと 監視のデザインパターン 2021 ©︎ ega4432 - Built with marp. 16

Slide 17

Slide 17 text

1. 組み合わせ可能 専用のツールを複数使って 「監視プラットフォーム」を作ろう 1 つのツールで賄おうとするのは NG 監視サービスそれぞれを疎結合に保 つ 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 17

Slide 18

Slide 18 text

2. ユーザ視点での監視 サーバが何台動いているかも大事だけど、「ユーザにどう影響がある か」を基準に考える。 監視についてみんなに知って欲しいこと 18

Slide 19

Slide 19 text

3. 作るより買う 結局 SaaS を導入した方が安い SaaS を導入するメリット プロダクト開発にフォーカス できる。 SaaS でできないことはほと んどない。 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 19

Slide 20

Slide 20 text

4. 継続的な改善 一朝一夕にはいかない Google, Facebook, Twitter, Netflix … どこも改善を繰り返し続け て今がある 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 20

Slide 21

Slide 21 text

監視についてみんなに知って欲しいこと ビジネス KPI 2021 ©︎ ega4432 - Built with marp. 21

Slide 22

Slide 22 text

経営者、創業者が知りたいこと 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 22

Slide 23

Slide 23 text

事業責任者の武器になるメトリクス 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 23

Slide 24

Slide 24 text

Pinterest の例 The 27 Metrics in Pinterest’s Internal Growth Dashboard : http://jwegan.com/growth-hacking/27-metrics-pinterests-internal- growth-dashboard/ ※ 本書では Yelp, Reddit という企業を例に取り扱っていました。 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 24

Slide 25

Slide 25 text

ビジネス KPI を技術指標に結び付ける 求人サービスの場合 ユーザのログイン ユーザのログイン失敗、ログインのレイテン シ 求人の作成 求人の作成失敗、求人作成のレイテンシ 応募の実施 応募の失敗、応募のレイテンシ ゴールド、ジェムの購入 購入失敗、購入のレイテンシ 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 25

Slide 26

Slide 26 text

監視についてみんなに知って欲しいこと フロントエンドの監視 2021 ©︎ ega4432 - Built with marp. 26

Slide 27

Slide 27 text

フロントエンドの監視 ユーザが見ているページのロード時間を監視する 100ms 早くすると売上げが 1% 増えるというデータがある JavaScript のエラーを監視する Navigation Timing API User Timing API Speed Index ページロード時間を CI システムで計測し続け、許容時間内に収ま るようにする 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 27

Slide 28

Slide 28 text

監視についてみんなに知って欲しいこと アプリケーション監視 2021 ©︎ ega4432 - Built with marp. 28

Slide 29

Slide 29 text

メトリクスとログによる監視 アプリケーションのパフォーマンスを把握し、トラブルシューティ ングする能力を高めるために最も重要なこと 小さなことから始める DB クエリの時間 外部 API のレスポンスタイム DAU/MAU 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 29

Slide 30

Slide 30 text

インフラに関係することを監視する ビルドとリリースのパイプライン デプロイとエラーの減少の因果関係 障害発生との関係性を早く発見 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 30

Slide 31

Slide 31 text

health エンドポイントパターン 最低限 HTTP ステータスコードを返すようにする セキュリティや懸念があるなら特定の IP からだけアクセスでき るようにしておく 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 31

Slide 32

Slide 32 text

サーバーレス or マイクロサービスの監 視 分散トレーシング 手法を使う この仕組みの構築はかなり根気のいることなので、向いているケ ースにだけ実行するようにする。 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 32

Slide 33

Slide 33 text

まとめ 監視のデザインパターン 1. 組み合わせ可能 2. ユーザ視点 3. 作るより買う 4. 継続的な改善 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 33

Slide 34

Slide 34 text

まとめ ビジネス KPI 自分のサービスの KPI を知る 技術指標に結びつけて計測する フロントエンドのパフォーマンスはビジネスに直結する アプリケーションのメトリクスとログも重要。小さなことから始め よう。 監視についてみんなに知って欲しいこと 2021 ©︎ ega4432 - Built with marp. 34

Slide 35

Slide 35 text

監視についてみんなに知って欲しいこと ご静聴ありがとうございました 2021 ©︎ ega4432 - Built with marp. 35