Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「Webエンジニアのための監視システム実装ガイド」発売!
Search
Toshiaki Baba
March 17, 2020
Technology
0
600
「Webエンジニアのための監視システム実装ガイド」発売!
#o11yjp Observability Japan Online #1 登壇資料
Toshiaki Baba
March 17, 2020
Tweet
Share
More Decks by Toshiaki Baba
See All by Toshiaki Baba
SREsのためのSRE定着ガイド
netmarkjp
12
8k
SREこのへんで苦戦しがちじゃないですか?
netmarkjp
13
6.3k
技術書を活用してほしい!
netmarkjp
0
480
しつこくじわじわパフォーマンスチューニング
netmarkjp
1
1.1k
現場がさき、 プラクティスがあと、 原則はだいじに
netmarkjp
4
2.7k
ばばさんは、なぜ本を書くの?という話
netmarkjp
0
740
SRE≠インフラなんだけどもう誤解されちゃってる から、DevOps新実装として Site Production Engineering はいかがでしょう?
netmarkjp
2
1.9k
非ITの事業会社にSREと言わずにSREを持ち込んだ
netmarkjp
16
30k
変化の激しいWebの世界でコンスタントに局面局面で勝つ方法論「OODAループ」
netmarkjp
0
1.9k
Other Decks in Technology
See All in Technology
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
0
190
サイバー攻撃を想定したセキュリティガイドライン 策定とASM及びCNAPPの活用方法
syoshie
3
1.2k
10分で学ぶKubernetesコンテナセキュリティ/10min-k8s-container-sec
mochizuki875
3
320
スタートアップで取り組んでいるAzureとMicrosoft 365のセキュリティ対策/How to Improve Azure and Microsoft 365 Security at Startup
yuj1osm
0
210
alecthomas/kong はいいぞ / kamakura.go#7
fujiwara3
1
300
Postman と API セキュリティ / Postman and API Security
yokawasa
0
200
社内イベント管理システムを1週間でAKSからACAに移行した話し
shingo_kawahara
0
180
フロントエンド設計にモブ設計を導入してみた / 20241212_cloudsign_TechFrontMeetup
bengo4com
0
1.9k
PHPからGoへのマイグレーション for DMMアフィリエイト
yabakokobayashi
1
160
私なりのAIのご紹介 [2024年版]
qt_luigi
1
120
オプトインカメラ:UWB測位を応用したオプトイン型のカメラ計測
matthewlujp
0
170
祝!Iceberg祭開幕!re:Invent 2024データレイク関連アップデート10分総ざらい
kniino
2
250
Featured
See All Featured
Site-Speed That Sticks
csswizardry
2
190
4 Signs Your Business is Dying
shpigford
181
21k
Unsuck your backbone
ammeep
669
57k
Put a Button on it: Removing Barriers to Going Fast.
kastner
59
3.6k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
665
120k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
0
94
A designer walks into a library…
pauljervisheath
204
24k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.1k
Designing for Performance
lara
604
68k
Reflections from 52 weeks, 52 projects
jeffersonlam
347
20k
Transcript
「Webエンジニアのための 監視システム実装ガイド」 発売! Observability Japan Online 2020-03-17
登場人物 2 @netmarkjp ばば としあき @ymotongpoo @katzchang Kazunori Otani
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコー ル...https://netmark.jp/2020/03/2020-03-03-21-21.html 3 https://amzn.to/330B1CQ
きっかけ 4 入門 監視 https://www.amazon.co.jp/dp/4873118646/ 2019/1/17発売 この本が全てのきっかけ 出版社:監視の本がアツいぞ… わたし:監視の本なら関わりたかった…
Webエンジニアのための監視システム実装ガイド 執筆経緯 2014-12-27 Webエンジニアが知っておきたいインフラの基本 発売 2019-02-08 ↑の編集さんから打診→本書の編集さんを紹介いただく 2019-02-08 企画書をいただく→目次案作成開始 2019-03-25
目次案fix(2019-04執筆開始⇒2019-09初旬脱稿予定) 2019-03-31 15時間でわかるMySQL実践入門 脱稿、本書を執筆開始 (2019-08に、2019-10初旬脱稿予定に変更) 2019-09-07 ISUCON予選⇒初日3位で久々に突破! 2019-10-05 ISUCON本選⇒11位... 2019-10-08 脱稿 2020-02-14 編集さんと初顔合わせ(基本メールだった) 2020-02-19 書名決定 2020-03-24 発売予定 5
ばばが本を書くときの気持ち • 自分の経験・知見をまとめて形にしたい ◦ 欲 • 毎度説明する代わりに「これ読んでください」したい ◦ Webエンジニアが知っておきたいインフラの基本はいまだに活躍しています •
自分の/エンジニアの常識・新常識を権威付けしたい ◦ 章を設けたりコラムを書いたりしました • 会社の宣伝をしたい ◦ 株式会社ハートビーツ https://heartbeats.jp/ MSP事業/開発事業やってます 6
Webエンジニアのための監視システム実装ガイド 概要1 Amazonのリード https://amzn.to/330B1CQ システムは、何もしないと壊れます。システムは、よくわからない状態になります。 どれだけ技術力の高いエンジニアが設計・構築しても、残念な事実として、システムを構築した後に何 もしないと壊れます、よくわからない状態になります。 システムを「監視」あるいは「モニタリング」することで、 ・異常を検知し復旧させること ・システムの価値を維持・向上させること
ができます。 本書では、監視テクノロジの動向から組織での実装まで、わかりやすく学ぶことができます。 最新ツールの説明、実装パターンの紹介だけでなく、組織での実装にあたっての態勢づくり、システム づくりについても現場目線で寄り添って解説しています。 これから監視を始める方にはもちろん、現状の監視システムに疑問を抱いている方にもおすすめの1冊で す。 7
Webエンジニアのための監視システム実装ガイド 概要2 8 監視(モニタリング)を -狭義:定期的・継続的に 、観測し異常を検知し復旧させること -広義:定期的・継続的に 、観測しシステムの価値を維持・向上させる営みの全て に分類し、まずは狭義→発展として広義を紹介しています。 監視システムの目的をチェック/メトリクスにわけて考え、それぞれの目的での
観測処理・観測結果収集・異常検知(判定)・通知などの流れや仕組みを解説し ています。 監視テクノロジ/運用の価値と限界、自己修復機構との役割分担について言及し ました。
もくじ 第1章 監視テクノロジの動向 1.1 システムにまつわる残念な事実 1.2 監視テクノロジの2つの志向性 1.3 監視テクノロジの動向 1.4
Webシステム運用の文化 第2章 監視テクノロジの概要 2.1 監視テクノロジで実現したいこと 2.2 可用性の測り方 2.3 監視システムの種類 2.4 監視システムの構成概要 2.5 自己修復機構と監視テクノロジ 2.6 自己修復システムの継続的運用を支える Chaos Engineering 第3章 監視テクノロジの基礎 3.1 監視テクノロジの基礎 3.2 観測部分の基礎技術 3.3 データ収集部分の基礎技術 3.4 データ利用部分の基礎技術 3.5 時系列データベースの基礎技術 3.6 ログの基礎技術 9 第4章 監視テクノロジの導⼊ 4.1 「監視」に対する期待 4.2 監視を始める 4.3 監視ツールどれにしよう問題 第5章 監視テクノロジの実装 5.1 アラーティングする / しないの基準 5.2 アラーティング目的の観測項目を決める 5.3 定番 の観測項目 第6章 インシデント対応実践編 6.1 インシデント対応の基礎知識 6.2 インシデント対応の心構え 6.3 インシデントが Open ステータスのときにやること 6.4 インシデントが Resolved ステータスのときにやること 6.5 恒久対応 / 改善対応 第7章 監視構成例 7.1 チェック、メトリクス、ログ、トレース、APMの構成 例 7.2 通知、 コミュニケーション、ドキュメント、チケット の構成例
小ネタ・コラム Pick up • Pets to Cattle ( ペットから家畜へ )
と Disposable ( 廃棄可能 ) ◦ インフラの常識の変化の話 • 時間ベースの可用性を採用するときに監視システム の実装から生じる制約 ◦ N分間隔のチェックだと変動の最小単位がN分だか ら%の測り方と目標値設定に注意 • 時間ベース ・ リクエストベースとその先の可用性 計算手法 ◦ Meaningful Availabilityの紹介 • 可用性指標の妥当性の検討 ◦ ユーザが喜ぶ/悲しむ指標はいい指標 • 自己修復機構を活かすための作り方の話 ◦ The Twelve-Factor Appの紹介 • 監視テクノロジで可用性は上がらない ! ◦ 下がりすぎないようにするもの • SLA は読み方が難しい ◦ 保証じゃなくて返金規準だし申請も難しい • MSP事業者の探し方 ◦ 宣伝 • 監視テクノロジを活用する我々はシステムのお医 者さんなのかもしれない ◦ 医療業界の「プライマリケア」の紹介 • コトにフォーカスして論理的にエンジニアリング しよう ◦ 直感や感情で対処してはならない ◦ トリプルチェックの実験結果の紹介 10
はじめに→ ディスカッションネタ帳 • 監視(モニタリング)にどっぷ りはまって/染まっていった理 由や経緯 • 監視/モニタリング関連のテク ノロジの魅力 •
監視/モニタリング関連の仕事 の魅力 11
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコール... 12 https://amzn.to/330B1CQ