Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Obs...
Search
Kento Kimura
PRO
March 18, 2025
Video
Technology
380
0
Share
AWS で広がるオブザーバビリティの世界 / Do SREs Dream of AWS Observability?
JAWS SRE #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
https://jawsug-sre.connpass.com/event/346434/
Kento Kimura
PRO
March 18, 2025
Video
More Decks by Kento Kimura
See All by Kento Kimura
Compose Spec の変遷と Cloud Run のイマ / The History of Compose Spec and Cloud Run Support
aoto
PRO
0
72
頼れる Agentic AI を支える Datadog のオブザーバビリティ / Powering Reliable Agentic AI with Datadog Observability
aoto
PRO
0
340
作りっぱなしで終わらせない! 価値を出し続ける AI エージェントのための「信頼性」設計 / Designing Reliability for AI Agents that Deliver Continuous Value
aoto
PRO
2
360
Google に学ぶ、安全性を高める信頼性設計 / Reliability Design for Enhanced Safety: Lessons from Google SRE
aoto
PRO
0
76
AI エージェントで AI エージェントを作る!Google Cloudが実現するフルスタックな AI 開発エコシステム / Building AI Agents with AI Agents! Full-Stack AI Development Ecosystem on Google Cloud
aoto
PRO
0
340
Jagu'e'r Advent Calendar でコミュニティを盛り上げよう / Join us the community with Jagu'e'r Advent Calendar
aoto
PRO
0
67
現場の壁を乗り越えて、 「計装注入」が拓く オブザーバビリティ / Beyond the Field Barriers: Instrumentation Injection and the Future of Observability
aoto
PRO
1
1.4k
「最速」で Gemini CLI を使いこなそう! 〜Cloud Shell/Cloud Run の活用〜 / The Fastest Way to Master the Gemini CLI — with Cloud Shell and Cloud Run
aoto
PRO
1
380
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
1k
Other Decks in Technology
See All in Technology
マルチプロダクトの信頼性を効率良く保っていくために
kworkdev
PRO
0
140
#jawsugyokohama 100 LT11, "My AWS Journey 2011-2026 - kwntravel"
shinichirokawano
0
340
JEDAI in Osaka 2026イントロ
taka_aki
0
290
AgentCore×VPCでの設計パターンn選と勘所
har1101
3
260
Master Dataグループ紹介資料
sansan33
PRO
1
4.6k
システムは「動く」だけでは足りない 実装編 - 非機能要件・分散システム・トレードオフをコードで見る
nwiizo
4
420
CloudSec JP #005 後締め ~ソフトウェアサプライチェーン攻撃から開発者のシークレットを守る~
lhazy
0
230
ワールドカフェI /チューターを改良する / World Café I and Improving the Tutors
ks91
PRO
0
290
Snowflake Intelligence導入で 分かった活用のコツ
wonohe
0
130
20年前の「OSS革命」に学ぶ AI時代の生存戦略
samakada
0
330
ARIA Notifyについて
ryokatsuse
1
120
クラウドネイティブな開発 ~ 認知負荷に立ち向かうためのコンテナ活用
literalice
0
110
Featured
See All Featured
AI: The stuff that nobody shows you
jnunemaker
PRO
6
570
Abbi's Birthday
coloredviolet
2
7k
Designing for Timeless Needs
cassininazir
0
190
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Typedesign – Prime Four
hannesfritz
42
3k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
140
For a Future-Friendly Web
brad_frost
183
10k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
800
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
500
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Building AI with AI
inesmontani
PRO
1
900
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
330
Transcript
AWS で広がる オブザーバビリティの世界 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』 Kento Kimura
SRE は AWS オブザーバビリティの 夢を見るか?🐏 18th Mar, AWS-UG SRE支部 #11『ちょっと遅いけど、SREにおけるre:Inventのお話しよ?』
Kento Kimura
• 所属:Technical Solutions / Sales Engineer • 担当:パブリッククラウドのアーキテクト知識を活かした Datadog のプリセールス技術支援
• 活動: 2023 Japan AWS Jr.Champion → AWS Community Builder(Cloud Operations) JAWS-UG にたまに出没する犬のロゴの会社の人です🐶 JAWS DAYS 2025 には個人スポンサー・当日スタッフとして参加しました🦈 好きな AWS サービスは CloudWatch Application Signals 木村 健人 (Kento Kimura) Datadog Japan GK Experience データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community JAWS-UG, Jagu'e'r, CloudNative Days あなたは誰?
おはなし 4 01 オブザーバビリティってなんだっけ? 02 オブザーバビリティ in AWS 03 re:Invent
2024 でどう変わった? 04 AWS Observability の夢をみる 05 まとめ
5 オブザーバビリティって なんだっけ?
6 SRE にとって オブザーバビリティって なんだっけ?
7 SRE and AWS 引用『サイト信頼性エンジニアリングと Amazon Web Services / SRE
and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws
Dickerson の信頼性階層(SRE のプラクティス) 8 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
Dickerson の信頼性階層(SRE のプラクティス) 9 引用『Site Reliability Engineering(サイト信頼性エンジニアリング)』https://sre.google/sre-book/part-III-practices/ UX 開発 キャパシティ計画
テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ
10 監視・オブザーバビリティは SRE プラクティスの入り口
11 オブザーバビリティ =「システムがその出力から 内部状態を推測できる状態」
12 オブザーバビリティ =「システムの状態(いつ・どこで・ 何が起こっているか)がわかる」
13 オブザーバビリティ in AWS
SRE のプラクティスと AWS サービス 14 参考『サイト信頼性エンジニアリングと Amazon Web Services /
SRE and AWS』https://speakerdeck.com/ymotongpoo/sre-and-aws?slide=24 UX 開発 キャパシティ計画 テスト・リリース 事後検証・根本原因分析 インシデント対応 監視・オブザーバビリティ Amazon CloudWatch Amazon Managed Grafana Amazon Managed Service for Prometheus AWS Distro for OpenTelemetry AWS X-Ray
15 オブザーバビリティ in AWS 引用『オブザーバビリティの観点でみる AWS』https://speakerdeck.com/ymotongpoo/aws-from-observability-perspective
CloudWatch のサービス群 16 Alarm RUM Logs Data protection Logs Synthetics
Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 17 Alarm RUM Event Evidently Logs
Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch
Deprecated/Retired Events CloudWatch のサービス群 18 Alarm RUM Logs Event Evidently
Metrics Logs Data protection Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Amazon CloudWatch Traces
Logs Deprecated/Retired Events Insights Application Metrics Network Inform CloudWatch のサービス群
19 Alarm RUM Event Evidently Logs Data protection Visualize Logs Synthetics Metrics Insights Dash boards Logs Anomaly Detection Live Tail Logs Insights Contributor Insights Metrics Streams Metrics Explorer X-ray Trace Map Transaction Search Service Map Service Level Objectives Synthetics Canaries Flow Monitors Internet Monitors EventBridge Rule EC2 Resource Health Database Insights Lambda Insights Application Insights Container Insights Traces Amazon CloudWatch
20 re: Invent 2024 で どう変わった?
たくさんのアップデート 21
たくさんのアップデート 22 で、何が変わったの? 🤔🤔🤔🤔🤔
何が変わったのか 23 ①マップを用いた可視化 ②監視データの検索性 ③トレースの強化
①マップを用いた可視化 24 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
①マップを用いた可視化 25 AWS サービスの各リソースをマップや図で可視化し、 視覚的にリソースに紐づく監視情報を確認できる! CloudWatch Insights の各機能 Operational troubleshooting
と呼ばれる、 任意のリソースに紐づくトポロジーマップを表示し 関連するメトリクスとログを確認できる! 全 CloudWatch コンソール画面からタブ表示
②監視データの検索性 26 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
②監視データの検索性 27 Operational troubleshooting によって リソースに紐づくメトリクス・ログが 同一画面で切り替えられる Performance Insight から
Database Insights となり Application Signals との統合で、どのアプリケーションが データベースを呼び出しているかが紐づくように CloudWatch Logs Insights で Zero-ETL により OpenSearch PPL/SQL を利用し、複雑なクエリや 直感的なログ検索ができる
③トレースの強化 28 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
③トレースの強化 29 X-Ray の機能だったトランザクション検索が、 CloudWatch のものになる アプリケーショントランザクションを示すトレースデータが CloudWatch Logs のログデータと同様に扱える
つまり… データマスキング・サブスクリプションフィルター・メトリクスフィルター などの恩恵を受けられるようになる!! Amazon CloudWatch AWS X-Ray
30 AWS オブザーバビリティ の 夢を見る
オブザーバビリティで大事なこと クラウドネイティブ技術の標準化を推進する Cloud Native Computing Foundation が提唱 する、Observability Whitepaper では、メトリクス・トレース・ログをはじめとする
監視データを相関させることの重要性が言及されています 31
オブザーバビリティの夢🐏 32 ①監視データの紐付き ②同一の検索性
問題が起きていそうな AWS リソースを見つける メトリクス・ログ・トレースの 検索に同じクエリや 直感的な操作ができる リソースに紐づく 監視データや 監視データに紐づく 別の監視データを確認する
オブザーバビリティの夢🐏 33
34 まとめ
まとめ • re: Invent 2024 で追加された CloudWatch のアップデートは オブザーバビリティの理想系に近づくための変化 •
新しく実装をしなくても、Operational troubleshooting のように CloudWatch コンソール自体も進化している • AWS でもトレースデータが扱いやすくなっていて、 分散トレースや APM を始めるチャンス! (Application Signals, ADOT に入門しましょう!) 35
Thank you