Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Obs...
Search
Kento Kimura
PRO
March 18, 2025
Video
Technology
0
220
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Observability?
JAWS SRE #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
https://jawsug-sre.connpass.com/event/346434/
Kento Kimura
PRO
March 18, 2025
Tweet
Share
Video
More Decks by Kento Kimura
See All by Kento Kimura
元祖 AIOps! メトリクス異常検知からはじめよう 〜さようなら Lookout for Metrics〜 / The Original AIOps! Let's get started with Metrics Anomaly Detection - Good-bye Lookout for Metrics
aoto
PRO
0
220
Dive Deep in Cloud Run: Automatic Base Image update
aoto
PRO
0
980
CloudWatch Application Signals と APM の入門 / Introduction to CloudWatch Application Signals and ApM
aoto
PRO
2
1.4k
Recap『Platform Engineering 入門: Golden Path の構築と活用』
aoto
PRO
0
1k
Two different ways to export AWS CloudWatch Metrics
aoto
PRO
0
1.1k
オブザーバビリティの再考
aoto
PRO
0
920
コンテナで Datadog APM をはじめよう
aoto
PRO
0
1.3k
分散トレースを理解する! Trace Context 解体新書 / Understanding Distributed Tracing! Trace Context Tabul Anatomic
aoto
PRO
6
3.9k
What's『What's Next ’24』
aoto
PRO
0
750
Other Decks in Technology
See All in Technology
Restarting_SRE_Road_to_SRENext_.pdf
_awache
0
140
開発組織全体で意識するSLI/SLOを実装している話
zepprix
1
800
Go製のマイグレーションツールの git-schemalex の紹介と運用方法
shinnosuke_kishida
1
360
30代エンジニアが考える、エンジニア生存戦略~~セキュリティを添えて~~
masakiokuda
4
2k
セマンティックレイヤー入門
ikkimiyazaki
8
2.5k
DIってなんだか難しい? 依存という概念を「使う・使われる」 という言葉で整理しよう
akinoriakatsuka
1
770
チームビルディング「脅威モデリング」ワークショップ
koheiyoshikawa
0
110
DevinはクラウドエンジニアAIになれるのか!? 実践的なガードレール設計/devin-can-become-a-cloud-engineer-ai-practical-guardrail-design
tomoki10
3
1.2k
お問い合わせ対応の改善取り組みとその進め方
masartz
1
280
caching_sha2_passwordのはなし
boro1234
0
200
技術好きなエンジニアが _リーダーへの進化_ によって得たものと失ったもの / The Gains and Losses of a Tech-Enthusiast Engineer’s “Evolution into Leadership”
kaminashi
0
200
「エンジニアマネージャー」の役割を担っている / 担ってみたい方へのキャリアパスガイド
coconala_engineer
1
240
Featured
See All Featured
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.5k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
176
52k
Designing Experiences People Love
moore
140
23k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
For a Future-Friendly Web
brad_frost
176
9.6k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
8
700
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
28
2k
Transcript
AWS で広がる オブザーバビリティの世界 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』 Kento Kimura
SRE は AWS オブザーバビリティの 夢を見るか?🐏 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
Kento Kimura
• 所属:Technical Solutions / Sales Engineer • 担当:パブリッククラウドのアーキテクト知識を活かした Datadog のプリセールス技術支援
• 活動: 2023 Japan AWS Jr.Champion → AWS Community Builder(Cloud Operations) JAWS-UG にたまに出没する犬のロゴの会社の人です🐶 JAWS DAYS 2025 には個人スポンサー・当日スタッフとして参加しました🦈 好きな AWS サービスは CloudWatch Application Signals 木村 健人 (Kento Kimura) Datadog Japan GK Experience データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community JAWS-UG, Jagu'e'r, CloudNative Days あなたは誰?
おはなし 4 01 オブザーバビリティってなんだっけ? 02 オブザーバビリティ in AWS 03 re:Invent
2024 でどう変わった? 04 AWS Observability の夢をみる 05 まとめ
5 オブザーバビリティって なんだっけ?
6 SRE にとって オブザーバビリティって なんだっけ?
7 SRE and AWS 引用『サイト信頼性エンジニアリングと Amazon Web Services / SRE
and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws
Dickerson の信頼性階層(SRE のプラクティス) 8 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
Dickerson の信頼性階層(SRE のプラクティス) 9 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
10 監視・オブザーバビリティは SRE プラクティスの入り口
11 オブザーバビリティ =「システムがその出力から 内部状態を推測できる状態」
12 オブザーバビリティ =「システムの状態(いつ・どこで・ 何が起こっているか)がわかる」
13 オブザーバビリティ in AWS
SRE のプラクティスと AWS サービス 14 参考『サイト信頼性エンジニアリングと Amazon Web Services /
SRE and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws?slide=24 UX 開発 キャパシティ計画 テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ Amazon CloudWatch Amazon Managed Grafana Amazon Managed Service for Prometheus AWS Distro for OpenTelemetry AWS X-Ray
15 オブザーバビリティ in AWS 引用『オブザーバビリティの観点でみる AWS』https://speakerdeck.com/ymotongpoo/aws-from-observability-perspective
CloudWatch のサービス群 16 Alarm RUM Logs Data protection Logs Synthetics
Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 17 Alarm RUM Event Evidently Logs
Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 18 Alarm RUM Logs Event Evidently
Metrics Logs Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch Traces
Logs Deprecated/Retired Events Insights Application Metrics Network Inform CloudWatch のサービス群
19 Alarm RUM Event Evidently Logs Data protection Visualize Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Traces Amazon CloudWatch
20 re: Invent 2024 で どう変わった?
たくさんのアップデート 21
たくさんのアップデート 22 で、何が変わったの? 🤔🤔🤔🤔🤔
何が変わったのか 23 ①マップを用いた可視化 ②監視データの検索性 ③トレースの強化
①マップを用いた可視化 24 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
①マップを用いた可視化 25 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
②監視データの検索性 26 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
②監視データの検索性 27 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
③トレースの強化 28 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
③トレースの強化 29 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
30 AWS オブザーバビリティ の 夢を見る
オブザーバビリティで大事なこと クラウドネイティブ技術の標準化を推進する Cloud Native Computing Foundation が提唱 する、Observability Whitepaper では、メトリクス・トレース・ログをはじめとする
監視データを相関させることの重要性が言及されています 31
オブザーバビリティの夢🐏 32 ①監視データの紐付き ②同一の検索性
問題が起きていそうな AWS リソースを見つける メトリクス・ログ・トレースの 検索に同じクエリや 直感的な操作ができる リソースに紐づく 監視データや 監視データに紐づく 別の監視データを確認する
オブザーバビリティの夢🐏 33
34 まとめ
まとめ • re: Invent 2024 で追加された CloudWatch のアップデートは オブザーバビリティの理想系に近づくための変化 •
新しく実装をしなくても、Operational troubleshooting のように CloudWatch コンソール自体も進化している • AWS でもトレースデータが扱いやすくなっていて、 分散トレースや APM を始めるチャンス! (Application Signals, ADOT に入門しましょう!) 35
Thank you