Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Obs...
Search
Kento Kimura
PRO
March 18, 2025
Video
Technology
0
290
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Observability?
JAWS SRE #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
https://jawsug-sre.connpass.com/event/346434/
Kento Kimura
PRO
March 18, 2025
Tweet
Share
Video
More Decks by Kento Kimura
See All by Kento Kimura
プラットフォームとしての Datadog / Datadog as Platforms
aoto
PRO
1
440
Cloud Run を解剖して コンテナ監視を考える / Breaking Down Cloud Run to Rethink Container Monitoring
aoto
PRO
0
150
Recap of Next - Google Cloud で実践する クラウドネイティブ最前線 / The Frontlines of Cloud-Native with Insights from Google Cloud
aoto
PRO
1
140
元祖 AIOps! メトリクス異常検知からはじめよう 〜さようなら Lookout for Metrics〜 / The Original AIOps! Let's get started with Metrics Anomaly Detection - Good-bye Lookout for Metrics
aoto
PRO
0
240
Dive Deep in Cloud Run: Automatic Base Image update
aoto
PRO
0
1k
CloudWatch Application Signals と APM の入門 / Introduction to CloudWatch Application Signals and APM
aoto
PRO
2
1.5k
Recap『Platform Engineering 入門: Golden Path の構築と活用』
aoto
PRO
0
1.1k
Two different ways to export AWS CloudWatch Metrics
aoto
PRO
0
1.2k
オブザーバビリティの再考
aoto
PRO
0
940
Other Decks in Technology
See All in Technology
OSSのSNSツール「Misskey」をさわってみよう(右下ワイプで私のOSCの20年を振り返ります) / 20250705-osc2025-do
akkiesoft
0
160
Lazy application authentication with Tailscale
bluehatbrit
0
210
20250707-AI活用の個人差を埋めるチームづくり
shnjtk
4
3.8k
American airlines ®️ USA Contact Numbers: Complete 2025 Support Guide
airhelpsupport
0
380
開発生産性を組織全体の「生産性」へ! 部門間連携の壁を越える実践的ステップ
sudo5in5k
2
7.1k
いつの間にか入れ替わってる!?新しいAWS Security Hubとは?
cmusudakeisuke
0
120
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
3
960
freeeのアクセシビリティの現在地 / freee's Current Position on Accessibility
ymrl
2
200
FOSS4G 2025 KANSAI QGISで点群データをいろいろしてみた
kou_kita
0
400
AIの全社活用を推進するための安全なレールを敷いた話
shoheimitani
2
510
「クラウドコスト絶対削減」を支える技術—FinOpsを超えた徹底的なクラウドコスト削減の実践論
delta_tech
4
170
整頓のジレンマとの戦い〜Tidy First?で振り返る事業とキャリアの歩み〜/Fighting the tidiness dilemma〜Business and Career Milestones Reflected on in Tidy First?〜
bitkey
2
16k
Featured
See All Featured
RailsConf 2023
tenderlove
30
1.1k
The Pragmatic Product Professional
lauravandoore
35
6.7k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
Visualization
eitanlees
146
16k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Producing Creativity
orderedlist
PRO
346
40k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.3k
Scaling GitHub
holman
460
140k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
950
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Automating Front-end Workflow
addyosmani
1370
200k
Transcript
AWS で広がる オブザーバビリティの世界 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』 Kento Kimura
SRE は AWS オブザーバビリティの 夢を見るか?🐏 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
Kento Kimura
• 所属:Technical Solutions / Sales Engineer • 担当:パブリッククラウドのアーキテクト知識を活かした Datadog のプリセールス技術支援
• 活動: 2023 Japan AWS Jr.Champion → AWS Community Builder(Cloud Operations) JAWS-UG にたまに出没する犬のロゴの会社の人です🐶 JAWS DAYS 2025 には個人スポンサー・当日スタッフとして参加しました🦈 好きな AWS サービスは CloudWatch Application Signals 木村 健人 (Kento Kimura) Datadog Japan GK Experience データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community JAWS-UG, Jagu'e'r, CloudNative Days あなたは誰?
おはなし 4 01 オブザーバビリティってなんだっけ? 02 オブザーバビリティ in AWS 03 re:Invent
2024 でどう変わった? 04 AWS Observability の夢をみる 05 まとめ
5 オブザーバビリティって なんだっけ?
6 SRE にとって オブザーバビリティって なんだっけ?
7 SRE and AWS 引用『サイト信頼性エンジニアリングと Amazon Web Services / SRE
and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws
Dickerson の信頼性階層(SRE のプラクティス) 8 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
Dickerson の信頼性階層(SRE のプラクティス) 9 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
10 監視・オブザーバビリティは SRE プラクティスの入り口
11 オブザーバビリティ =「システムがその出力から 内部状態を推測できる状態」
12 オブザーバビリティ =「システムの状態(いつ・どこで・ 何が起こっているか)がわかる」
13 オブザーバビリティ in AWS
SRE のプラクティスと AWS サービス 14 参考『サイト信頼性エンジニアリングと Amazon Web Services /
SRE and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws?slide=24 UX 開発 キャパシティ計画 テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ Amazon CloudWatch Amazon Managed Grafana Amazon Managed Service for Prometheus AWS Distro for OpenTelemetry AWS X-Ray
15 オブザーバビリティ in AWS 引用『オブザーバビリティの観点でみる AWS』https://speakerdeck.com/ymotongpoo/aws-from-observability-perspective
CloudWatch のサービス群 16 Alarm RUM Logs Data protection Logs Synthetics
Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 17 Alarm RUM Event Evidently Logs
Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 18 Alarm RUM Logs Event Evidently
Metrics Logs Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch Traces
Logs Deprecated/Retired Events Insights Application Metrics Network Inform CloudWatch のサービス群
19 Alarm RUM Event Evidently Logs Data protection Visualize Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Traces Amazon CloudWatch
20 re: Invent 2024 で どう変わった?
たくさんのアップデート 21
たくさんのアップデート 22 で、何が変わったの? 🤔🤔🤔🤔🤔
何が変わったのか 23 ①マップを用いた可視化 ②監視データの検索性 ③トレースの強化
①マップを用いた可視化 24 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
①マップを用いた可視化 25 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
②監視データの検索性 26 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
②監視データの検索性 27 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
③トレースの強化 28 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
③トレースの強化 29 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
30 AWS オブザーバビリティ の 夢を見る
オブザーバビリティで大事なこと クラウドネイティブ技術の標準化を推進する Cloud Native Computing Foundation が提唱 する、Observability Whitepaper では、メトリクス・トレース・ログをはじめとする
監視データを相関させることの重要性が言及されています 31
オブザーバビリティの夢🐏 32 ①監視データの紐付き ②同一の検索性
問題が起きていそうな AWS リソースを見つける メトリクス・ログ・トレースの 検索に同じクエリや 直感的な操作ができる リソースに紐づく 監視データや 監視データに紐づく 別の監視データを確認する
オブザーバビリティの夢🐏 33
34 まとめ
まとめ • re: Invent 2024 で追加された CloudWatch のアップデートは オブザーバビリティの理想系に近づくための変化 •
新しく実装をしなくても、Operational troubleshooting のように CloudWatch コンソール自体も進化している • AWS でもトレースデータが扱いやすくなっていて、 分散トレースや APM を始めるチャンス! (Application Signals, ADOT に入門しましょう!) 35
Thank you