Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「Webエンジニアのための監視システム実装ガイド」発売!
Search
Toshiaki Baba
March 17, 2020
Technology
0
700
「Webエンジニアのための監視システム実装ガイド」発売!
#o11yjp Observability Japan Online #1 登壇資料
Toshiaki Baba
March 17, 2020
Tweet
Share
More Decks by Toshiaki Baba
See All by Toshiaki Baba
Forkewell Library 103 『バックエンドエンジニアのためのインフラ・クラウド大全』を通じたエンジニアとしての地力獲得活動のススメ
netmarkjp
9
3.7k
AI時代にも変わらぬ価値を発揮したい: インフラ・クラウドを切り口にユーザー価値と非機能要件に向き合ってエンジニアとしての地力を培う
netmarkjp
0
460
著者による『バックエンドエンジニアのためのインフラ・クラウド大全』120%活用術
netmarkjp
1
1k
SREsのためのSRE定着ガイド
netmarkjp
12
9.4k
SREこのへんで苦戦しがちじゃないですか?
netmarkjp
13
6.9k
技術書を活用してほしい!
netmarkjp
0
610
しつこくじわじわパフォーマンスチューニング
netmarkjp
1
1.4k
現場がさき、 プラクティスがあと、 原則はだいじに
netmarkjp
4
3.3k
ばばさんは、なぜ本を書くの?という話
netmarkjp
0
1.1k
Other Decks in Technology
See All in Technology
Oracle Cloud Infrastructure:2025年9月度サービス・アップデート
oracle4engineer
PRO
0
390
20250929_QaaS_vol20
mura_shin
0
110
生成AI_その前_に_マルチクラウド時代の信頼できるデータを支えるSnowflakeメタデータ活用術.pdf
cm_mikami
0
110
PLaMo2シリーズのvLLM実装 / PFN LLM セミナー
pfn
PRO
2
970
Why Governance Matters: The Key to Reducing Risk Without Slowing Down
sarahjwells
0
110
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
3
20k
「AI駆動PO」を考えてみる - 作る速さから価値のスループットへ:検査・適応で未来を開発 / AI-driven product owner. scrummat2025
yosuke_nagai
4
580
Trust as Infrastructure
bcantrill
0
330
許しとアジャイル
jnuank
1
120
非エンジニアのあなたもできる&もうやってる!コンテキストエンジニアリング
findy_eventslides
3
910
それでも私はContextに値を詰めたい | Go Conference 2025 / go conference 2025 fill context
budougumi0617
4
1.2k
自作LLM Native GORM Pluginで実現する AI Agentバックテスト基盤構築
po3rin
2
250
Featured
See All Featured
Producing Creativity
orderedlist
PRO
347
40k
Facilitating Awesome Meetings
lara
56
6.6k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
127
53k
Automating Front-end Workflow
addyosmani
1371
200k
Side Projects
sachag
455
43k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
6.1k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
33
2.5k
Transcript
「Webエンジニアのための 監視システム実装ガイド」 発売! Observability Japan Online 2020-03-17
登場人物 2 @netmarkjp ばば としあき @ymotongpoo @katzchang Kazunori Otani
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコー ル...https://netmark.jp/2020/03/2020-03-03-21-21.html 3 https://amzn.to/330B1CQ
きっかけ 4 入門 監視 https://www.amazon.co.jp/dp/4873118646/ 2019/1/17発売 この本が全てのきっかけ 出版社:監視の本がアツいぞ… わたし:監視の本なら関わりたかった…
Webエンジニアのための監視システム実装ガイド 執筆経緯 2014-12-27 Webエンジニアが知っておきたいインフラの基本 発売 2019-02-08 ↑の編集さんから打診→本書の編集さんを紹介いただく 2019-02-08 企画書をいただく→目次案作成開始 2019-03-25
目次案fix(2019-04執筆開始⇒2019-09初旬脱稿予定) 2019-03-31 15時間でわかるMySQL実践入門 脱稿、本書を執筆開始 (2019-08に、2019-10初旬脱稿予定に変更) 2019-09-07 ISUCON予選⇒初日3位で久々に突破! 2019-10-05 ISUCON本選⇒11位... 2019-10-08 脱稿 2020-02-14 編集さんと初顔合わせ(基本メールだった) 2020-02-19 書名決定 2020-03-24 発売予定 5
ばばが本を書くときの気持ち • 自分の経験・知見をまとめて形にしたい ◦ 欲 • 毎度説明する代わりに「これ読んでください」したい ◦ Webエンジニアが知っておきたいインフラの基本はいまだに活躍しています •
自分の/エンジニアの常識・新常識を権威付けしたい ◦ 章を設けたりコラムを書いたりしました • 会社の宣伝をしたい ◦ 株式会社ハートビーツ https://heartbeats.jp/ MSP事業/開発事業やってます 6
Webエンジニアのための監視システム実装ガイド 概要1 Amazonのリード https://amzn.to/330B1CQ システムは、何もしないと壊れます。システムは、よくわからない状態になります。 どれだけ技術力の高いエンジニアが設計・構築しても、残念な事実として、システムを構築した後に何 もしないと壊れます、よくわからない状態になります。 システムを「監視」あるいは「モニタリング」することで、 ・異常を検知し復旧させること ・システムの価値を維持・向上させること
ができます。 本書では、監視テクノロジの動向から組織での実装まで、わかりやすく学ぶことができます。 最新ツールの説明、実装パターンの紹介だけでなく、組織での実装にあたっての態勢づくり、システム づくりについても現場目線で寄り添って解説しています。 これから監視を始める方にはもちろん、現状の監視システムに疑問を抱いている方にもおすすめの1冊で す。 7
Webエンジニアのための監視システム実装ガイド 概要2 8 監視(モニタリング)を -狭義:定期的・継続的に 、観測し異常を検知し復旧させること -広義:定期的・継続的に 、観測しシステムの価値を維持・向上させる営みの全て に分類し、まずは狭義→発展として広義を紹介しています。 監視システムの目的をチェック/メトリクスにわけて考え、それぞれの目的での
観測処理・観測結果収集・異常検知(判定)・通知などの流れや仕組みを解説し ています。 監視テクノロジ/運用の価値と限界、自己修復機構との役割分担について言及し ました。
もくじ 第1章 監視テクノロジの動向 1.1 システムにまつわる残念な事実 1.2 監視テクノロジの2つの志向性 1.3 監視テクノロジの動向 1.4
Webシステム運用の文化 第2章 監視テクノロジの概要 2.1 監視テクノロジで実現したいこと 2.2 可用性の測り方 2.3 監視システムの種類 2.4 監視システムの構成概要 2.5 自己修復機構と監視テクノロジ 2.6 自己修復システムの継続的運用を支える Chaos Engineering 第3章 監視テクノロジの基礎 3.1 監視テクノロジの基礎 3.2 観測部分の基礎技術 3.3 データ収集部分の基礎技術 3.4 データ利用部分の基礎技術 3.5 時系列データベースの基礎技術 3.6 ログの基礎技術 9 第4章 監視テクノロジの導⼊ 4.1 「監視」に対する期待 4.2 監視を始める 4.3 監視ツールどれにしよう問題 第5章 監視テクノロジの実装 5.1 アラーティングする / しないの基準 5.2 アラーティング目的の観測項目を決める 5.3 定番 の観測項目 第6章 インシデント対応実践編 6.1 インシデント対応の基礎知識 6.2 インシデント対応の心構え 6.3 インシデントが Open ステータスのときにやること 6.4 インシデントが Resolved ステータスのときにやること 6.5 恒久対応 / 改善対応 第7章 監視構成例 7.1 チェック、メトリクス、ログ、トレース、APMの構成 例 7.2 通知、 コミュニケーション、ドキュメント、チケット の構成例
小ネタ・コラム Pick up • Pets to Cattle ( ペットから家畜へ )
と Disposable ( 廃棄可能 ) ◦ インフラの常識の変化の話 • 時間ベースの可用性を採用するときに監視システム の実装から生じる制約 ◦ N分間隔のチェックだと変動の最小単位がN分だか ら%の測り方と目標値設定に注意 • 時間ベース ・ リクエストベースとその先の可用性 計算手法 ◦ Meaningful Availabilityの紹介 • 可用性指標の妥当性の検討 ◦ ユーザが喜ぶ/悲しむ指標はいい指標 • 自己修復機構を活かすための作り方の話 ◦ The Twelve-Factor Appの紹介 • 監視テクノロジで可用性は上がらない ! ◦ 下がりすぎないようにするもの • SLA は読み方が難しい ◦ 保証じゃなくて返金規準だし申請も難しい • MSP事業者の探し方 ◦ 宣伝 • 監視テクノロジを活用する我々はシステムのお医 者さんなのかもしれない ◦ 医療業界の「プライマリケア」の紹介 • コトにフォーカスして論理的にエンジニアリング しよう ◦ 直感や感情で対処してはならない ◦ トリプルチェックの実験結果の紹介 10
はじめに→ ディスカッションネタ帳 • 監視(モニタリング)にどっぷ りはまって/染まっていった理 由や経緯 • 監視/モニタリング関連のテク ノロジの魅力 •
監視/モニタリング関連の仕事 の魅力 11
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコール... 12 https://amzn.to/330B1CQ