Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「Webエンジニアのための監視システム実装ガイド」発売!
Search
Toshiaki Baba
March 17, 2020
Technology
0
630
「Webエンジニアのための監視システム実装ガイド」発売!
#o11yjp Observability Japan Online #1 登壇資料
Toshiaki Baba
March 17, 2020
Tweet
Share
More Decks by Toshiaki Baba
See All by Toshiaki Baba
SREsのためのSRE定着ガイド
netmarkjp
12
8.4k
SREこのへんで苦戦しがちじゃないですか?
netmarkjp
13
6.4k
技術書を活用してほしい!
netmarkjp
0
510
しつこくじわじわパフォーマンスチューニング
netmarkjp
1
1.2k
現場がさき、 プラクティスがあと、 原則はだいじに
netmarkjp
4
2.8k
ばばさんは、なぜ本を書くの?という話
netmarkjp
0
800
SRE≠インフラなんだけどもう誤解されちゃってる から、DevOps新実装として Site Production Engineering はいかがでしょう?
netmarkjp
2
2k
非ITの事業会社にSREと言わずにSREを持ち込んだ
netmarkjp
16
30k
変化の激しいWebの世界でコンスタントに局面局面で勝つ方法論「OODAループ」
netmarkjp
0
2k
Other Decks in Technology
See All in Technology
次世代KYC活動報告 / 20250219-BizDay17-KYC-nextgen
oidfj
0
250
君も受託系GISエンジニアにならないか
sudataka
2
430
クラウドサービス事業者におけるOSS
tagomoris
1
510
AndroidXR 開発ツールごとの できることできないこと
donabe3
0
130
Classmethod AI Talks(CATs) #17 司会進行スライド(2025.02.19) / classmethod-ai-talks-aka-cats_moderator-slides_vol17_2025-02-19
shinyaa31
0
110
Cloud Spanner 導入で実現した快適な開発と運用について
colopl
1
560
現場の種を事業の芽にする - エンジニア主導のイノベーションを事業戦略に装着する方法 -
kzkmaeda
2
2k
PHPカンファレンス名古屋-テックリードの経験から学んだ設計の教訓
hayatokudou
0
220
2.5Dモデルのすべて
yu4u
2
840
2/18/25: Java meets AI: Build LLM-Powered Apps with LangChain4j
edeandrea
PRO
0
110
管理者しか知らないOutlookの裏側のAIを覗く#AzureTravelers
hirotomotaguchi
2
350
Data-centric AI入門第6章:Data-centric AIの実践例
x_ttyszk
1
400
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
306
110k
How to Ace a Technical Interview
jacobian
276
23k
Git: the NoSQL Database
bkeepers
PRO
427
64k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
120k
The World Runs on Bad Software
bkeepers
PRO
67
11k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.4k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.7k
Bash Introduction
62gerente
611
210k
Making Projects Easy
brettharned
116
6k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
100
18k
Building a Scalable Design System with Sketch
lauravandoore
461
33k
The Language of Interfaces
destraynor
156
24k
Transcript
「Webエンジニアのための 監視システム実装ガイド」 発売! Observability Japan Online 2020-03-17
登場人物 2 @netmarkjp ばば としあき @ymotongpoo @katzchang Kazunori Otani
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコー ル...https://netmark.jp/2020/03/2020-03-03-21-21.html 3 https://amzn.to/330B1CQ
きっかけ 4 入門 監視 https://www.amazon.co.jp/dp/4873118646/ 2019/1/17発売 この本が全てのきっかけ 出版社:監視の本がアツいぞ… わたし:監視の本なら関わりたかった…
Webエンジニアのための監視システム実装ガイド 執筆経緯 2014-12-27 Webエンジニアが知っておきたいインフラの基本 発売 2019-02-08 ↑の編集さんから打診→本書の編集さんを紹介いただく 2019-02-08 企画書をいただく→目次案作成開始 2019-03-25
目次案fix(2019-04執筆開始⇒2019-09初旬脱稿予定) 2019-03-31 15時間でわかるMySQL実践入門 脱稿、本書を執筆開始 (2019-08に、2019-10初旬脱稿予定に変更) 2019-09-07 ISUCON予選⇒初日3位で久々に突破! 2019-10-05 ISUCON本選⇒11位... 2019-10-08 脱稿 2020-02-14 編集さんと初顔合わせ(基本メールだった) 2020-02-19 書名決定 2020-03-24 発売予定 5
ばばが本を書くときの気持ち • 自分の経験・知見をまとめて形にしたい ◦ 欲 • 毎度説明する代わりに「これ読んでください」したい ◦ Webエンジニアが知っておきたいインフラの基本はいまだに活躍しています •
自分の/エンジニアの常識・新常識を権威付けしたい ◦ 章を設けたりコラムを書いたりしました • 会社の宣伝をしたい ◦ 株式会社ハートビーツ https://heartbeats.jp/ MSP事業/開発事業やってます 6
Webエンジニアのための監視システム実装ガイド 概要1 Amazonのリード https://amzn.to/330B1CQ システムは、何もしないと壊れます。システムは、よくわからない状態になります。 どれだけ技術力の高いエンジニアが設計・構築しても、残念な事実として、システムを構築した後に何 もしないと壊れます、よくわからない状態になります。 システムを「監視」あるいは「モニタリング」することで、 ・異常を検知し復旧させること ・システムの価値を維持・向上させること
ができます。 本書では、監視テクノロジの動向から組織での実装まで、わかりやすく学ぶことができます。 最新ツールの説明、実装パターンの紹介だけでなく、組織での実装にあたっての態勢づくり、システム づくりについても現場目線で寄り添って解説しています。 これから監視を始める方にはもちろん、現状の監視システムに疑問を抱いている方にもおすすめの1冊で す。 7
Webエンジニアのための監視システム実装ガイド 概要2 8 監視(モニタリング)を -狭義:定期的・継続的に 、観測し異常を検知し復旧させること -広義:定期的・継続的に 、観測しシステムの価値を維持・向上させる営みの全て に分類し、まずは狭義→発展として広義を紹介しています。 監視システムの目的をチェック/メトリクスにわけて考え、それぞれの目的での
観測処理・観測結果収集・異常検知(判定)・通知などの流れや仕組みを解説し ています。 監視テクノロジ/運用の価値と限界、自己修復機構との役割分担について言及し ました。
もくじ 第1章 監視テクノロジの動向 1.1 システムにまつわる残念な事実 1.2 監視テクノロジの2つの志向性 1.3 監視テクノロジの動向 1.4
Webシステム運用の文化 第2章 監視テクノロジの概要 2.1 監視テクノロジで実現したいこと 2.2 可用性の測り方 2.3 監視システムの種類 2.4 監視システムの構成概要 2.5 自己修復機構と監視テクノロジ 2.6 自己修復システムの継続的運用を支える Chaos Engineering 第3章 監視テクノロジの基礎 3.1 監視テクノロジの基礎 3.2 観測部分の基礎技術 3.3 データ収集部分の基礎技術 3.4 データ利用部分の基礎技術 3.5 時系列データベースの基礎技術 3.6 ログの基礎技術 9 第4章 監視テクノロジの導⼊ 4.1 「監視」に対する期待 4.2 監視を始める 4.3 監視ツールどれにしよう問題 第5章 監視テクノロジの実装 5.1 アラーティングする / しないの基準 5.2 アラーティング目的の観測項目を決める 5.3 定番 の観測項目 第6章 インシデント対応実践編 6.1 インシデント対応の基礎知識 6.2 インシデント対応の心構え 6.3 インシデントが Open ステータスのときにやること 6.4 インシデントが Resolved ステータスのときにやること 6.5 恒久対応 / 改善対応 第7章 監視構成例 7.1 チェック、メトリクス、ログ、トレース、APMの構成 例 7.2 通知、 コミュニケーション、ドキュメント、チケット の構成例
小ネタ・コラム Pick up • Pets to Cattle ( ペットから家畜へ )
と Disposable ( 廃棄可能 ) ◦ インフラの常識の変化の話 • 時間ベースの可用性を採用するときに監視システム の実装から生じる制約 ◦ N分間隔のチェックだと変動の最小単位がN分だか ら%の測り方と目標値設定に注意 • 時間ベース ・ リクエストベースとその先の可用性 計算手法 ◦ Meaningful Availabilityの紹介 • 可用性指標の妥当性の検討 ◦ ユーザが喜ぶ/悲しむ指標はいい指標 • 自己修復機構を活かすための作り方の話 ◦ The Twelve-Factor Appの紹介 • 監視テクノロジで可用性は上がらない ! ◦ 下がりすぎないようにするもの • SLA は読み方が難しい ◦ 保証じゃなくて返金規準だし申請も難しい • MSP事業者の探し方 ◦ 宣伝 • 監視テクノロジを活用する我々はシステムのお医 者さんなのかもしれない ◦ 医療業界の「プライマリケア」の紹介 • コトにフォーカスして論理的にエンジニアリング しよう ◦ 直感や感情で対処してはならない ◦ トリプルチェックの実験結果の紹介 10
はじめに→ ディスカッションネタ帳 • 監視(モニタリング)にどっぷ りはまって/染まっていった理 由や経緯 • 監視/モニタリング関連のテク ノロジの魅力 •
監視/モニタリング関連の仕事 の魅力 11
Webエンジニアのための監視システム実装ガイド 第1章 監視テクノロジの動向 第2章 監視テクノロジの概要 第3章 監視テクノロジの基礎 第4章 監視テクノロジの導⼊ 第5章
監視テクノロジの実装 第6章 インシデント対応実践編 第7章 監視構成例 【Topic】監視テクノロジの歴史や特徴、監視システムの基 本動作と動作方式ごとの特徴、時系列データベース、 DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、 Availability、Observability、自己修復システム、Chaos Engineering、監視方式のActive/Passive、メトリクス収集 方式のPush/Pull、オンコール... 12 https://amzn.to/330B1CQ