Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
監視論Ⅳ ~監視からオブザーバビリティーへの招待~
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Qryuu
June 22, 2022
Technology
510
0
Share
監視論Ⅳ ~監視からオブザーバビリティーへの招待~
Ops JAWS Meetup#21 で登壇した資料です。
ITシステムの進化史とそれに合わせて求められる運用とは
監視からオブザーバビリティーが求められるようになった背景を説明します。
Qryuu
June 22, 2022
More Decks by Qryuu
See All by Qryuu
人体モニタリングによる運動療法継続
qryuu
0
200
オブザーバビリティで理解するコンピュータサイエンス
qryuu
1
1.7k
監視とは何か ~監視エンジニアのスキルと成長~
qryuu
8
8.9k
監視論 ~SREと次世代MSP~
qryuu
10
5.1k
Other Decks in Technology
See All in Technology
おいらのAWSアップデートの追い方〜Slack×AgentCore〜
yakumo
1
110
ECSのTerraformモジュールにコントリビュートした話
harukasakihara
0
160
How to learn AWS Well-Architected with AWS BuilderCards: Security Edition
coosuke
PRO
0
140
20260515 ログイン機能だけではないアカウント管理を全体で考える~サービス設計者向け~
oidfj
0
590
AI対話分析の夢と、汚いデータの現実 Looker / Dataplex / Dataform で実現する品質ファーストな基盤設計
waiwai2111
0
520
PdM・Eng・QAで進めるAI駆動開発の現在地/aidd-with-pdm-eng-qa
shota_kusaba
0
240
クラウドネイティブ DB はいかにして制約を 克服したか? 〜進化歴史から紐解く、スケーラブルアーキテクチャ設計指針〜
hacomono
PRO
6
1k
O'Reilly Infrastructure & Ops Superstream: Platform Engineering for Developers, Architects & the Rest of Us
syntasso
0
160
100マイクロサービスのTerraform/Kubernetes管理地獄から抜け出すためのAI活用術
markie1009
0
150
freeeで運用しているAIQAについて
qatonchan
1
620
バイブコーディング、仕様駆動、その先へ - 「不確実性に対する検査‧適応のサイクル」を設計する
littlehands
1
240
そのSLO 99.9%、本当に必要ですか? 〜優先度付きSLOによる責任共有の設計思想〜 / Is that 99.9% SLO really necessary? Design philosophy of shared responsibility through prioritized SLOs
vtryo
0
740
Featured
See All Featured
The Spectacular Lies of Maps
axbom
PRO
1
740
The Mindset for Success: Future Career Progression
greggifford
PRO
0
330
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
230
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
520
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
Six Lessons from altMBA
skipperchong
29
4.2k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
65
54k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.7k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
250
1.3M
Documentation Writing (for coders)
carmenintech
77
5.3k
Bash Introduction
62gerente
615
210k
Transcript
監視論Ⅳ 監視からオブザーバビリティーへの招待
自己紹介 ▪ PN:九龍真乙 ▪ Twitter:qryuu ▪ SlideShre:https://www.slideshare.net/qryuu ▪ GitHub:https://github.com/qryuu ▪
クックパッド:https://cookpad.com/kitchen/4142562 ▪ 専門:New Relic, Zabbix,カスタマーサポート,テクニカルサ ポート
ITシステムの進化史
ITシステムの進化史 ▪ 汎用機(SES:ベンダーロックイン) ▪ オープンシステム(ITの民主化) ▪ 仮想化(スケーリングの獲得) ▪ クラウド(オートスケーリング・アジリティの獲得) ▪
コンテナ(IaC コントローラビリティの獲得)
汎用機の時代 ▪ 1960~70年代 ▪ メインフレーム、オフコンの時 代 ▪ 商社や金融など大規模な経理・ 事務・会計などで利用 ▪
メーカー毎に差異があり、非常 に高額なため 「ハードを買うとオペレーター が付いてくる」 ▪ メーカーのオペレーターがビジ ネスロジックを把握しているた め狭義のベンダーロックイン (画像出典)総務省令和元年版 情報通信白書
オープンシステムの時代 ▪ 1980~90年代 ▪ クライアント/サーバー方式 ▪ IAサーバ(PCサーバー)と 汎用OSによるシステム構築 ▪ マルチベンダー構成、内製
化が可能に ▪ ITシステムの民主化 (画像出典) https://atmarkit.itmedia.co.jp/fsys/kaisetsu/043server_bto/server_bto.html
仮想化の時代 ▪ 2000年代 ▪ IAサーバの高性能化・低価 格化 ▪ システム規模に対して性能 過剰 ▪
仮想化によって、サーバー リソースを無駄なく使う ▪ ITシステムの基盤化・抽象化 (画像出典) https://www.networld.co.jp/product/vmware/technical_guide/virtualization/
クラウドの時代 ▪ 2010年代 ▪ 仮想化基盤の外部化 ▪ 所有から利用へ ▪ 自動化・オートスケーリン グ
▪ システム構成のコード化 (画像出典) https://aws.amazon.com/jp/cloud/
コンテナの時代 ▪ 2020年代 ▪ オーケストレーションによる 自律化 ▪ インフラのコード化の推進 ▪ アプリケーションとインフラ
の一体化 (画像出典) https://frontier.networld.co.jp/3182/
ITシステムが進化する理由
システムはビジネスそのものになりつつある 11 1980年〜 2000年〜 2010年〜 メインフレーム・オープンシステム インターネット・WEB・ガラケー クラウド・スマートフォン・AI・IoT モード1:業務効率化 モード2:価値の提供
業務効率化 自動化/情報分析 事業創造 メールやドキュメントなど インターネット検索やeコマース システム = ビジネス システム=ビジネス そのものになる時代へ
ITシステム進化の目的 ▪ よりダウンしないシステムへ ▪ より効率的なシステムへ ▪ より良いシステムを目指した結果、自動化や自律化によってシス テム構成が複雑に。 12
監視からオブザーバビリティへ
監視からオブザーバビリティへ ▪ 監視 ▪ 症状が出たら専門医にかかる ▪ オブザーバビリティ ▪ 各種センサー、記録係を付けて 生活する
15
監視からオブザーバビリティへ ▪ 監視では障害通知があると 、CPUやメモリなどの値を 確認します。 原因はわからないけど、異常は見られないので頭痛薬飲んでおきましょう >とりあえず再起動 死活 監視 反応があるか
Ping Metric 体温・血圧 CPU使用率/メモリ 使用率 Log 「頭が痛い」 Errorメッセージ
監視からオブザーバビリティへ ▪ オブザーバビリティではよ り多くの情報を収集し、何 が起こったのかを明らかに して根本原因に対処します 。 ▪ 障害ではなくて「いつもと 違う」を検知して対処しま
す。 Metric 気温・気圧・湿 度・体温・血圧 CPU/メモリ使用 率・プロセス・ User満足度・応答 時間 Event 昨日19時から2時 まで飲みに行っ た リクエスト数・プ ログラム処理時間 (トランザクショ ン) Log 「今朝から頭が 痛い」 Errorlog、スタッ クトレース Trace 飲み屋でBさんと テキーラ10杯飲 んだ DB呼び出し、API 呼び出し 二日酔いですね、この頭痛薬と胃腸薬を飲みましょ う 深酒しちゃだめですよ、節制しましょう >原因の究明と、システムの改善
ITモニタリングの変化 ペットモデル ▪ 小数のサーバーを管理 ▪ 大切なペットを守るよう に ▪ システムはステートフル ▪
モノリシック キャトル(家畜)モデル ▪ 同じ機能の複数のサー バーによるクラスタ ▪ 家畜の群れのように管理 ▪ AutoScalingや AutoHealingの設定 ▪ アプリ/DBなどは分離さ れるがアーキテクチャは モノリシック オルガノ(臓器)モデル ▪ コンテナによるオーケス トレション ▪ 臓器のように個々のコン テナが増殖やアポトーシ ス(自死)を行う ▪ コンテナ1つ1つの監視で はなくシステムとしての 機能提供を確認する
コンテナ時代に求められるオブザーバビリティ ▪ 外形監視・Synthetics による稼働確認 – 常に実際のユーザーと同じようにサービスにアクセスし、動作し続けてい る事を確認する。 ▪ RealUserMonitoring –
モバイルやBrowserなど、サーバー以外の環境で実際のユーザにErrorが 発生していないか、性能が劣化していないかを確認する。 ▪ 開発品質Monitoring – デプロイ前後でのパフォーマンス比較や、デプロイ頻度など開発品質その もののモニタリング ▪ K8S管理、クラスター管理 – 単体コンテナでは無く、サービスとしてのSLI/SLOを把握する。
まとめ ▪ ITシステムはビジネスで活用され、ITシステム自体が利益の源 泉へと進化しています。 ▪ ITシステムはビジネスや社会の要請に合わせて、より安定、よ り高可用性な仕組みを目指してきました。 ▪ その結果として抽象化が進み、システム全体は複雑化します。 ▪
進化したシステムを運用するためには、運用技術も進化する必 要があります。 ▪ そのためにDevSecOpsもカバーするオブザーバビリティーの 理解が必要です。