Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「Webエンジニアのための監視システム実装ガイド」発売!
Search
Toshiaki Baba
March 17, 2020
Technology
0
700
「Webエンジニアのための監視システム実装ガイド」発売!
#o11yjp Observability Japan Online #1 登壇資料
Toshiaki Baba
March 17, 2020
Tweet
Share
More Decks by Toshiaki Baba
See All by Toshiaki Baba
Forkewell Library 103 『バックエンドエンジニアのためのインフラ・クラウド大全』を通じたエンジニアとしての地力獲得活動のススメ
netmarkjp
9
3.8k
AI時代にも変わらぬ価値を発揮したい: インフラ・クラウドを切り口にユーザー価値と非機能要件に向き合ってエンジニアとしての地力を培う
netmarkjp
0
480
著者による『バックエンドエンジニアのためのインフラ・クラウド大全』120%活用術
netmarkjp
1
1.1k
SREsのためのSRE定着ガイド
netmarkjp
12
9.5k
SREこのへんで苦戦しがちじゃないですか?
netmarkjp
13
6.9k
技術書を活用してほしい!
netmarkjp
0
620
しつこくじわじわパフォーマンスチューニング
netmarkjp
1
1.4k
現場がさき、 プラクティスがあと、 原則はだいじに
netmarkjp
4
3.3k
ばばさんは、なぜ本を書くの?という話
netmarkjp
0
1.1k
Other Decks in Technology
See All in Technology
AWSでAgentic AIを開発するための前提知識の整理
nasuvitz
2
190
Data Hubグループ 紹介資料
sansan33
PRO
0
2.2k
AI時代こそ求められる設計力- AWSクラウドデザインパターン3選で信頼性と拡張性を高める-
kenichirokimura
3
350
データ戦略部門 紹介資料
sansan33
PRO
1
3.8k
フレームワークを意識させないワークショップづくり
keigosuda
0
200
OAuthからOIDCへ ― 認可の仕組みが認証に拡張されるまで
yamatai1212
0
140
エンタメとAIのための3Dパラレルワールド構築(GPU UNITE 2025 特別講演)
pfn
PRO
0
520
プレーリーカードを活用しよう❗❗デジタル名刺交換からはじまるイベント会場交流のススメ
tsukaman
0
180
ソースを読むプロセスの例
sat
PRO
15
9.2k
ガバメントクラウドの概要と自治体事例(名古屋市)
techniczna
3
240
Dylib Hijacking on macOS: Dead or Alive?
patrickwardle
0
280
RDS の負荷が高い場合に AWS で取りうる具体策 N 連発/a-series-of-specific-countermeasures-available-on-aws-when-rds-is-under-high-load
emiki
7
4k
Featured
See All Featured
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
115
20k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
[RailsConf 2023] Rails as a piece of cake
palkan
57
5.9k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.1k
Site-Speed That Sticks
csswizardry
13
910
Making Projects Easy
brettharned
120
6.4k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
The Illustrated Children's Guide to Kubernetes
chrisshort
49
51k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Mobile First: as difficult as doing things right
swwweet
225
10k
How GitHub (no longer) Works
holman
315
140k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Transcript
「Webエンジニアのための 監視システム実装ガイド」 発売! Observability Japan Online 2020-03-17
登場人物 2 @netmarkjp ばば としあき @ymotongpoo @katzchang Kazunori Otani
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコー ル...https://netmark.jp/2020/03/2020-03-03-21-21.html 3 https://amzn.to/330B1CQ
きっかけ 4 入門 監視 https://www.amazon.co.jp/dp/4873118646/ 2019/1/17発売 この本が全てのきっかけ 出版社:監視の本がアツいぞ… わたし:監視の本なら関わりたかった…
Webエンジニアのための監視システム実装ガイド 執筆経緯 2014-12-27 Webエンジニアが知っておきたいインフラの基本 発売 2019-02-08 ↑の編集さんから打診→本書の編集さんを紹介いただく 2019-02-08 企画書をいただく→目次案作成開始 2019-03-25
目次案fix(2019-04執筆開始⇒2019-09初旬脱稿予定) 2019-03-31 15時間でわかるMySQL実践入門 脱稿、本書を執筆開始 (2019-08に、2019-10初旬脱稿予定に変更) 2019-09-07 ISUCON予選⇒初日3位で久々に突破! 2019-10-05 ISUCON本選⇒11位... 2019-10-08 脱稿 2020-02-14 編集さんと初顔合わせ(基本メールだった) 2020-02-19 書名決定 2020-03-24 発売予定 5
ばばが本を書くときの気持ち • 自分の経験・知見をまとめて形にしたい ◦ 欲 • 毎度説明する代わりに「これ読んでください」したい ◦ Webエンジニアが知っておきたいインフラの基本はいまだに活躍しています •
自分の/エンジニアの常識・新常識を権威付けしたい ◦ 章を設けたりコラムを書いたりしました • 会社の宣伝をしたい ◦ 株式会社ハートビーツ https://heartbeats.jp/ MSP事業/開発事業やってます 6
Webエンジニアのための監視システム実装ガイド 概要1 Amazonのリード https://amzn.to/330B1CQ システムは、何もしないと壊れます。システムは、よくわからない状態になります。 どれだけ技術力の高いエンジニアが設計・構築しても、残念な事実として、システムを構築した後に何 もしないと壊れます、よくわからない状態になります。 システムを「監視」あるいは「モニタリング」することで、 ・異常を検知し復旧させること ・システムの価値を維持・向上させること
ができます。 本書では、監視テクノロジの動向から組織での実装まで、わかりやすく学ぶことができます。 最新ツールの説明、実装パターンの紹介だけでなく、組織での実装にあたっての態勢づくり、システム づくりについても現場目線で寄り添って解説しています。 これから監視を始める方にはもちろん、現状の監視システムに疑問を抱いている方にもおすすめの1冊で す。 7
Webエンジニアのための監視システム実装ガイド 概要2 8 監視(モニタリング)を -狭義:定期的・継続的に 、観測し異常を検知し復旧させること -広義:定期的・継続的に 、観測しシステムの価値を維持・向上させる営みの全て に分類し、まずは狭義→発展として広義を紹介しています。 監視システムの目的をチェック/メトリクスにわけて考え、それぞれの目的での
観測処理・観測結果収集・異常検知(判定)・通知などの流れや仕組みを解説し ています。 監視テクノロジ/運用の価値と限界、自己修復機構との役割分担について言及し ました。
もくじ 第1章 監視テクノロジの動向 1.1 システムにまつわる残念な事実 1.2 監視テクノロジの2つの志向性 1.3 監視テクノロジの動向 1.4
Webシステム運用の文化 第2章 監視テクノロジの概要 2.1 監視テクノロジで実現したいこと 2.2 可用性の測り方 2.3 監視システムの種類 2.4 監視システムの構成概要 2.5 自己修復機構と監視テクノロジ 2.6 自己修復システムの継続的運用を支える Chaos Engineering 第3章 監視テクノロジの基礎 3.1 監視テクノロジの基礎 3.2 観測部分の基礎技術 3.3 データ収集部分の基礎技術 3.4 データ利用部分の基礎技術 3.5 時系列データベースの基礎技術 3.6 ログの基礎技術 9 第4章 監視テクノロジの導⼊ 4.1 「監視」に対する期待 4.2 監視を始める 4.3 監視ツールどれにしよう問題 第5章 監視テクノロジの実装 5.1 アラーティングする / しないの基準 5.2 アラーティング目的の観測項目を決める 5.3 定番 の観測項目 第6章 インシデント対応実践編 6.1 インシデント対応の基礎知識 6.2 インシデント対応の心構え 6.3 インシデントが Open ステータスのときにやること 6.4 インシデントが Resolved ステータスのときにやること 6.5 恒久対応 / 改善対応 第7章 監視構成例 7.1 チェック、メトリクス、ログ、トレース、APMの構成 例 7.2 通知、 コミュニケーション、ドキュメント、チケット の構成例
小ネタ・コラム Pick up • Pets to Cattle ( ペットから家畜へ )
と Disposable ( 廃棄可能 ) ◦ インフラの常識の変化の話 • 時間ベースの可用性を採用するときに監視システム の実装から生じる制約 ◦ N分間隔のチェックだと変動の最小単位がN分だか ら%の測り方と目標値設定に注意 • 時間ベース ・ リクエストベースとその先の可用性 計算手法 ◦ Meaningful Availabilityの紹介 • 可用性指標の妥当性の検討 ◦ ユーザが喜ぶ/悲しむ指標はいい指標 • 自己修復機構を活かすための作り方の話 ◦ The Twelve-Factor Appの紹介 • 監視テクノロジで可用性は上がらない ! ◦ 下がりすぎないようにするもの • SLA は読み方が難しい ◦ 保証じゃなくて返金規準だし申請も難しい • MSP事業者の探し方 ◦ 宣伝 • 監視テクノロジを活用する我々はシステムのお医 者さんなのかもしれない ◦ 医療業界の「プライマリケア」の紹介 • コトにフォーカスして論理的にエンジニアリング しよう ◦ 直感や感情で対処してはならない ◦ トリプルチェックの実験結果の紹介 10
はじめに→ ディスカッションネタ帳 • 監視(モニタリング)にどっぷ りはまって/染まっていった理 由や経緯 • 監視/モニタリング関連のテク ノロジの魅力 •
監視/モニタリング関連の仕事 の魅力 11
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコール... 12 https://amzn.to/330B1CQ