Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS Well-Architected から考えるオブザーバビリティの勘所 / Consid...
Search
SMS tech
July 18, 2025
Technology
3
1.4k
AWS Well-Architected から考えるオブザーバビリティの勘所 / Considering the Essentials of Observability from AWS Well-Architected
Japan Datadog User Group Meetup#11@福岡
https://datadog-jp.connpass.com/event/358184/
SMS tech
July 18, 2025
Tweet
Share
More Decks by SMS tech
See All by SMS tech
AWS DevOps Agent vs SRE俺 / AWS DevOps Agent vs me, the SRE
sms_tech
2
280
カイポケコネクトのフロントエンドコミュニティとGraphQLスタックの更新/advancing-the-graphql-stack-update-in-the-frontend-community
sms_tech
0
77
フロントエンド専任がいないチームのNext.js移行と、その後/Renewal to Next.js for a team without a dedicated front-end developer, and what happened next
sms_tech
0
110
マルチプロダクトのカオスを制す。「プロダクトディシジョンレコード」で実現するチーム横断のアラインメント戦略/Introduction to Product Decision Record
sms_tech
0
2.3k
The Modelの罠を超える! 売上9割 "SLG" のVertical SaaSが挑む PLG × SLG ハイブリッド戦略 #pmconf2025/Defying "The Model": How a Vertical SaaS Integrates PLG into a 90% SLG Motion
sms_tech
0
2.7k
業務の本質理解から始まるリニューアル/ RethinkingBusinessEssenceforRenewal
sms_tech
1
280
プロジェクトを止めない。ライブラリの共存戦略とバージョンアップ/ChakraUI v3 Migration: Keeping Projects Running
sms_tech
0
180
失敗ら再構築した開発推進チームの立ち上げ
sms_tech
0
1k
一体いつから ――― DataLoader が 並列実行されていると錯覚していた?
sms_tech
0
420
Other Decks in Technology
See All in Technology
Introduction to Bill One Development Engineer
sansan33
PRO
0
380
問い合わせ自動化の技術的挑戦
recruitengineers
PRO
2
170
DevOpsエージェントで実現する!! AWS Well-Architected(W-A) を実現するシステム設計 / 20260307 Masaki Okuda
shift_evolve
PRO
3
220
大規模サービスにおける レガシーコードからReactへの移行
magicpod
1
150
OCI Security サービス 概要
oracle4engineer
PRO
2
13k
LINE Messengerの次世代ストレージ選定
lycorptech_jp
PRO
19
7.5k
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
72k
Oracle Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
4
1.1k
マルチロールEMが実践する「組織のレジリエンス」を高めるための組織構造と人材配置戦略
coconala_engineer
3
540
クラウド時代における一時権限取得
krrrr38
1
170
Kaggleで鍛えたスキルの実務での活かし方 競技とプロダクト開発のリアル
recruitengineers
PRO
1
190
新職業『オーケストレーター』誕生 — エージェント10体を同時に回すAgentOps
gunta
4
1.6k
Featured
See All Featured
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
190
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
360
Leo the Paperboy
mayatellez
4
1.5k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
96
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
67
37k
Accessibility Awareness
sabderemane
0
73
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
How to Think Like a Performance Engineer
csswizardry
28
2.5k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
150
GitHub's CSS Performance
jonrohan
1032
470k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Transcript
© SMS Co., Ltd. 加我 貴志 (株式会社エス・エム・エス) Japan Datadog User
Group Meetup#11@福岡 (2025/07/18) AWS Well-Architected から考える オブザーバビリティの勘所
© SMS Co., Ltd. 本日の発表は文字多めです
© SMS Co., Ltd. 自己紹介 • 加我 貴志 ( TAKA_0411)
• 株式会社エス・エム・エス プロダクト推進本部 カイポケ開発部 • Media-JAWS / JAWS-UG札幌運営 • JDDUG 札幌運営メンバー (1) • 気になるサービス : Bits AI SRE
© SMS Co., Ltd. JDDUG 札幌運営メンバー (1) https://x.com/k6s4i53rx/status/1927667815429161451
© SMS Co., Ltd. 突然ですが AWS Well-Architected ご存知ですか?
© SMS Co., Ltd. AWS Well-Architected (1) AWS Well-Architected https://aws.amazon.com/jp/architecture/well-architected/
© SMS Co., Ltd. AWS Well-Architected (2) AWS Well-Architected https://aws.amazon.com/jp/architecture/well-architected/
© SMS Co., Ltd. つまり AWS Well-Architected とは - AWSにおける設計や運用のベストプラクティスの指針
- 6つの柱 (カテゴリ) で構成されている - 特定の業界やテクノロジー領域に広げたものや、 特定のユースケース、テクノロジーに焦点を当てたものもある
© SMS Co., Ltd. ここで問題です
© SMS Co., Ltd. オブザーバビリティに関する柱はどれでしょう AWS Well-Architected https://aws.amazon.com/jp/architecture/well-architected/
© SMS Co., Ltd. 正解は・・・
© SMS Co., Ltd. オペレーショナルエクセレンスの柱でした AWS Well-Architected https://aws.amazon.com/jp/architecture/well-architected/
© SMS Co., Ltd. オペレーショナル エクセレンス
© SMS Co., Ltd. オペレーショナルエクセレンス (1) オペレーショナルエクセレンス https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/framework/operational-excellence.html 運用上の優秀性 (OE)
とは、優れたカスタマーエクスペリエンスを着実 に提供しながら、ソフトウェアを正しく構築する取り組みです。 運用上の優秀性の柱となるのは、チームの編成、ワークロードの設計、 ワークロードの大規模な運用、経時的な進化のためのベストプラクティス です。 お客様に満足してもらうため、チー ムで協力しシステムを安全・効率的 に動かし続けること
© SMS Co., Ltd. オペレーショナルエクセレンス (2) オペレーショナルエクセレンス https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/framework/operational-excellence.html 運用上の優秀性を実現するための設計原則 -
ビジネス成果を中心にチームを編成する - オブザーバビリティを実装して実用的なインサイトを得る - 可能な場合は安全に自動化する - 小規模かつ可逆的な変更を頻繁に行う - オペレーション手順を頻繁に改善する - 障害を予測する - 運用上のイベントとメトリクスから学ぶ - マネージドサービスを使用する
© SMS Co., Ltd. オブザーバビリティの 実装 準備
© SMS Co., Ltd. オブザーバビリティの実装 - OPS04-BP01 主要業績評価指標を特定する - OPS04-BP02
アプリケーションテレメトリを実装する - OPS04-BP03 ユーザーエクスペリエンステレメトリを実装する - OPS04-BP04 依存関係のテレメトリを実装する - OPS04-BP05 分散トレースを実装する
© SMS Co., Ltd. OPS04-BP01 主要業績評価指標を特定する OPS04-BP01 主要業績評価指標を特定する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html これは何か
オブザーバビリティを実装するためにはワークロードの状態を理解し、 ビジネス目標に直結するKPIの定義に基づいてモニタリングを行う。 なぜやるのか KPIは技術的なメトリクスよりも問題発生時の特定やビジネスへの影響把握が容易であり、 モニタリングアクティビティがビジネス成果につながっていることを確認できる。 主なアンチパターン ビジネスの成果と直接の相互関係がない、または実際の問題との関連性が 明らかでない技術的なメトリクスに重点が置かれている。
© SMS Co., Ltd. OPS04-BP02 アプリケーションテレメトリを実装する OPS04-BP02 アプリケーションテレメトリを実装する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_observability_application_telemetry.html これは何か
ワークロードの状態やビジネスの成果に関するテレメトリを送出するため、 メトリクス、ログ、トレースといった主要なテレメトリを利用する。 なぜやるのか ワークロードのパフォーマンスに関するインサイトを活用することで、パフォーマンスの 最適化に関する意思決定や運用の効率化、CI/CDの合理化、リソースの最適化につながる。 主なアンチパターン データが複数のツールやシステムに分散している場合、ワークロードの状態と パフォーマンスを包括的に把握することが困難になる。
© SMS Co., Ltd. OPS04-BP03 ユーザーエクスペリエンステレメトリを実装する OPS04-BP03 ユーザーエクスペリエンステレメトリを実装する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html これは何か
リアルユーザーモニタリングや合成トランザクションを利用し、 ユーザー体験の質を可視化する。 なぜやるのか ユーザーエクスペリエンステレメトリを実装することで、システムの健全性と顧客満足度の 向上が期待でき、実際のユーザーに影響が及ぶ前に潜在的な問題を検出できる。 主なアンチパターン このテレメトリを実装しない場合、ユーザーからの苦情があるまでパフォーマンスの ボトルネックや問題に気付けずユーザーの満足度に影響を及ぼす可能性がある。
© SMS Co., Ltd. OPS04-BP04 依存関係のテレメトリを実装する OPS04-BP04 依存関係のテレメトリを実装する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_observability_dependency_telemetry.html これは何か
ワークロードが依存する外部サービスのテレメトリを出力し、 外部サービスの状態とパフォーマンスを可視化する。 なぜやるのか ワークロードを支える依存関係が期待どおりに機能し、潜在的な障害やボトルネックを 早期に発見・対処することでワークロード全体のパフォーマンスと健全性を維持できる。 主なアンチパターン アプリケーションのメトリクスのみを重視し、外部の依存関係に関連するメトリクスを おろそかにすると問題の発見を遅らせてしまう。
© SMS Co., Ltd. OPS04-BP05 分散トレースを実装する OPS04-BP05 分散トレースを実装する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html これは何か
分散システムのリクエストをモニタリングし、リクエストの流れや ワークロードに発生している問題を把握する。 なぜやるのか 分散システムを通過するリクエストを包括的に把握することにより、正確なデバッグ、 パフォーマンスの最適化、ユーザー体験の向上が期待できる。 主なアンチパターン 一部サービスのみでトレースを実装し、全体像が把握できていない。
© SMS Co., Ltd. ワークロードの オブザーバビリティ活用 運用
© SMS Co., Ltd. ワークロードのオブザーバビリティの活用 - OPS08-BP01 ワークロードメトリクスを分析する - OPS08-BP02
ワークロードログを分析する - OPS08-BP03 ワークロードのトレースを分析する - OPS08-BP04 実践的なアラートを作成する - OPS08-BP05 ダッシュボードを作成する
© SMS Co., Ltd. OPS08-BP01 ワークロードメトリクスを分析する OPS08-BP01 ワークロードメトリクスを分析する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_analyze_workload_metrics.html これは何か
アプリケーションテレメトリを実装したら収集したメトリクスを定期的に分析する。 なぜやるのか ワークロードのパフォーマンスを正確に把握することで、データに基づいた 意思決定ができるようになり、ビジネス目標と合致させることができる。 主なアンチパターン ビジネス上のメトリクスを重視せず、過度に技術メトリクスに頼ってしまったり、 メトリクスを定期的に見直さないために変化や異常を見逃している。
© SMS Co., Ltd. OPS08-BP02 ワークロードログを分析する OPS08-BP02 ワークロードログを分析する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_analyze_workload_logs.html これは何か
ワークロードの動作やパフォーマンス、セキュリティといった問題を把握するため、 ワークロードログを定期的に分析・可視化する。 なぜやるのか 詳細なログ分析を行うことでアプリケーションの動作と運用に関するインサイトが得られ、 運用上のボトルネックやセキュリティリスクを事前に検出できる。 主なアンチパターン 重大なインシデント時のみログを見る対応や、ツールを十分に活用せず 手動での確認に頼る運用、分析そのものを怠り重要なインサイトを見逃している。
© SMS Co., Ltd. OPS08-BP03 ワークロードのトレースを分析する OPS08-BP03 ワークロードのトレースを分析する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_analyze_workload_traces.html これは何か
コンポーネント間の相互作用を可視化して把握し、パフォーマンスチューニング、 ボトルネックの特定、ユーザーエクスペリエンスの向上に活用する。 なぜやるのか アプリケーションやサービスの間で発生する処理の流れを可視化することにより、 各コンポーネントのパフォーマンスや依存関係、エラーの根本原因を特定できる。 主なアンチパターン ログとメトリクスのみに依存しておりトレースデータを見落としてしまったり、 トレースデータが関連するログと関連付けられていない。
© SMS Co., Ltd. OPS08-BP04 実践的なアラートを作成する OPS08-BP04 実践的なアラートを作成する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_create_alerts.html これは何か
業務やシステムにインパクトがあるような重要なアラートを設定する。 なぜやるのか KPIと連動したアラートを設定することでビジネスへの影響が小さい警告や 無関係なアラートの乱発を避け、ノイズによる「アラート疲れ」を防止する。 主なアンチパターン 重要ではないアラートが多すぎて、本当に重大なインシデントを見逃してしまったり、 KPIによる優先度付けがなくて対応の優先順位がつけられない。
© SMS Co., Ltd. OPS08-BP05 ダッシュボードを作成する OPS08-BP05 ダッシュボードを作成する https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_create_dashboards.html これは何か
ワークロードのテレメトリデータを視覚化するダッシュボードを構築し、 システムやビジネスの状態をリアルタイムに把握・共有する。 なぜやるのか 重要なKPIとシステムメトリクスを即座に可視化し、 システムの健全性やビジネス成果に関するインサイトを即座に提供できる。 主なアンチパターン メトリクスが多すぎてダッシュボードが複雑化し使いにくくなってしまったり、 システムやワークロードの変更にダッシュボードが追従できていない。
© SMS Co., Ltd. まとめ
© SMS Co., Ltd. まとめ - オブザーバビリティを実装・活用するうえで AWS Well-Architected はとても参考になります
- Datadogをより上手に活用するための指針としても オペレーショナル・エクセレンスの章はオススメです - 改めてビジネスと連携したモニタリングアクティビティが できているのかを振り返ってみませんか?