Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
観測から行動へ Datadog で実現する"活きる"オブザーバビリティ
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Shuntaro Azuma
December 17, 2025
Technology
17
0
Share
観測から行動へ Datadog で実現する"活きる"オブザーバビリティ
Datadog Live Tokyo 2025 12 月の登壇資料になります。
https://www.event-site.info/datadog-live-tokyo-2025/
Shuntaro Azuma
December 17, 2025
More Decks by Shuntaro Azuma
See All by Shuntaro Azuma
AI 時代の個人趣味開発 と Google Cloud
a2ush
0
22
Datadog で実現するセキュリティ対策 ~オブザーバビリティとセキュリティを 一緒にやると何がいいのか~
a2ush
0
220
AI 駆動開発と Datadog
a2ush
0
93
kubelet は俺の上司。今日もコンテナを作る。
a2ush
0
100
Other Decks in Technology
See All in Technology
ルールやカスタム機能、どう使う?理想の出力を引き出すために今知りたいIBM Bob 5つの機能
muehara
0
150
Spring Boot における AOT Cache 活用テクニックと 起動時間改善事例
ntt_dsol_java
0
180
管理アカウント単一運用からAWS Organizationsに移行するの大変で滅
hiramax
0
320
Platform Engineering as a Product: Criteria for Improvement and Multi-Tenant Design
kumorn5s
0
390
さきさん文庫の書籍ができるまで
sakiengineer
0
320
JEP 522 Deep Dive - G1 GC同期コスト削減によるスループット向上を徹底検証&解説
tabatad
1
390
基礎から解説!Icebergで紐解くSnowflake×Databricks連携の現在地
cm_yasuhara
0
390
AI時代に改めて考える、ドメイン駆動設計 - モデリングが「AIへの共通言語」になる
littlehands
8
2.9k
脅威をエンジニアリングの糧にして:恐怖を乗り越えた先にあったもの / Turn threats into fuel for engineering: what lay beyond overcoming fear
nrslib
1
350
権限管理設計を完全に理解した
rsugi
2
240
大規模災害時でも高い信頼性を維持するアプリケーション基盤の実現/nikkei-tech-talk46
nikkei_engineer_recruiting
0
120
シンデレラなんかになりたくない!ガラスの靴が割れた時代にどう歩く?
nomizone
0
220
Featured
See All Featured
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.3k
BBQ
matthewcrist
89
10k
Side Projects
sachag
455
43k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
220
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
Amusing Abliteration
ianozsvald
1
190
Evolving SEO for Evolving Search Engines
ryanjones
0
210
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
370
The Cost Of JavaScript in 2023
addyosmani
55
10k
How GitHub (no longer) Works
holman
316
150k
Between Models and Reality
mayunak
4
310
Transcript
観測から行動へ Datadogで実現する "活きる"オブザーバビリティ Datadog Sales Engineer Shuntaro Azuma / 東
峻太朗 Datadog Live Tokyo 2025 12 月 登壇資料
アジェンダ • オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと
4 つの観測データ ~フロントからバックエンドまで~ • Datadog における 4 つの観測データの “活かし方” • まとめ 本セッションの 目的 • 「データを観測し”活用できる”」とはどういうことなのかを理解する • Datadog ではどのように “活用できる” のか知っていただく 来場者参加型デモ デモ
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
オブザーバビリティ は属人化を排除します オブザーバビリティ によって MTTR(平均修復時間)を短縮できます オブザーバビリティ のおかげで システムの健全性が向上しました オブザーバビリティ とは何なのでしょうか
世の中の声
取得情報からシステムの状態を 推測・説明できる能力 = 活用できる能力 観測 能力 オブザーバビリティ( Observability) = Observe
+ Ability システムを運用する上で必要な 情報を取得でき 、 オブザーバビリティ とは 情報を “容易に” 確認でき、次のアクションへ “素早く” 繋げられること
ケーススタディ - 単一サーバ(モノリシックシステム) オブザーバビリティとは言い難い例 CPU 使用率メトリクスを確認し、 高負荷状態にあることが分かった サーバーにログインし、プロセスや ログを直接見て原因を推測できる Observe
+ Ability CPU使用率 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 オブザーバビリティと言える例 どのプロセスがメトリクス高騰に起因し、 そのプロセスはどんな処理をしているのか “素早く” 調査できる スペック増強すべきかプロセスの処理を 見直すべきなのか “容易に” 判断できる pid 1 pid 10 Observe + Ability
オブザーバビリティとは言い難い例 CPU 使用率メトリクスを確認し、 値が高かったことが分かった サーバーにログインし、プロセスや ログを直接見て原因を推測する Observe + Ability ケーススタディ
- 単一サーバ(モノリシックシステム) CPU使用率 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 オブザーバビリティと言える例 どのプロセスがメトリクス高騰に起因し、 そのプロセスはどんな処理をしているのか “素早く” 調査できる スペック増強すべきかプロセスの処理を 見直すべきなのか “容易に” 判断できる pid 1 pid 10 Observe + Ability オブザーバビリティ ツールには • 必要な情報が十分に収集できるか だけでなく • いかに簡単に活用できるか が求められる
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
直感的な UI で簡単に操作でき 相関付いたデータから瞬時に洞察が得られる Datadog という 1 つのプラットフォームで 多種多様な情報が取得できる Datadog
の Observe + Ability Observe + Ability 観測 能力
それぞれが独立して稼働するサーバ群の中から 高負荷状態にあるサーバを 1 台特定し、その原因を探ります ケーススタディ - 単一サーバ(モノリシックシステム) デモ 特に以下の観点でデモをご覧ください •
収集されたデータが Datadog UI 上でどう表現されているか • 画面の操作性はどうか • 複数のデータへのアクセスがどれほど容易に行えるか
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
単一サーバ(モノリシック)で運用していた時代と異なり、 アーキテクチャの分散化や外部連携の増加により、監視対象は多面化 現代システムの潮流 モノリシック vs マイクロサービス pid 1 pid 10
オブザーバビリティに取り組むにあたり、 何を Observe(観測) するといいのでしょうか モノリシック マイクロサービス App1 App2 App3 Observe + Ability の部分を考えます コンテナ サーバ サーバレス App1 App2 App3
一般的に メトリクス、ログ、トレース の 3 つ データを取得するのがいいと言われています 出典:CNCF Observability White Paper
現代システムにおける Observe(観測) メトリクス ログ 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 トレース / Main Handler Sub Call
現代システムにおける Observe(観測) メトリクス ログ 2025-12-16 xx:xx log 1 2025-12-16 yy:yy
loglog 2025-12-16 zz:zz log 2 トレース / Main Handler Sub Call これらは バックエンド の観測 バックエンドの観測だけでは “実際のユーザー体験 ” を捉えきれません システムを使っているユーザ(*) (*)モバイル端末 世帯保有率 97.4% 出典: 総務省 令和6年版情報通信白書
ケーススタディ - UI を持つマイクロサービス バックエンドの観測のみ フロント+バックエンドの観測 API の成功、サービス間の遅延、 内部エラーの調査は可能 トレース
トレース トレース ログ メトリクス UI 崩れや描画速度、エラーに遭遇した ユーザの画面操作再現 などは確認できない しかし..
ケーススタディ - UI を持つマイクロサービス バックエンドの観測のみ フロント+バックエンドの観測 API の成功、サービス間の遅延、 内部エラーの調査は可能 ユーザーが実際にどの画面で、どの操作中に
問題に直面したのかを特定可能 表示速度・操作感・レンダリングの状態など “体感性能”を数値で把握できる フロントのエラーとバックエンドの処理を 紐づけ、原因を端から端まで追跡できる トレース トレース トレース ログ メトリクス ユーザー体験
現代システムにおける Observe(観測) トレース トレース トレース ログ メトリクス ユーザー体験 メトリクス (インフラ)
ログ トレース ユーザー体験 + フロントエンド バックエンド そしてただ 4 つのデータを収集するだけでなく、 “活用” できて初めてオブザーバビリティ( Observe + Ability)
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
バックエンドからフロントまで一貫調査でき ユーザ行動・マーケティング分析も可能 バックエンドだけでなくフロントエンドに 関する情報ももちろん取得可能 Datadog と 4 つの観測データ Observe +
Ability 観測 能力
来場者皆様にマイクロサービスで構築されたデモサイトへアクセスしていただき、 発生したエラーを Datadog でどう調査するのか 画面操作がどのように Datadog で分析できるのか を確認します 来場者参加型デモ 1.
気に入ったステッカーをいくつか購入してみてください 2. 1 つのステッカーを大量購入(例: 100億個)してみてください ケーススタディ - UI を持つ現代システム 皆様に お願いしたいこと
エラー発生ユーザーの体験を起点に アプリ全体の挙動を追跡し原因を特定します 障害対応 デモンストレーション 1 「処理が遅い」の裏側で何が起きているかを 傾向分析からボトルネックの特定まで実施します パフォーマンス改善 2 行動データから利用パターンを把握し
プロダクト改善やマーケ施策に活用します ユーザー行動分析 3
フロントの Observe(観測) によって エラー発生時の実ユーザの行動履歴やコンバージョン率まで簡単に分析することができ バックエンドの Observe(観測)によって エラーの原因やパフォーマンス分析が瞬時に特定、フロントエンドと紐づけて確認できる Datadog における 4
つの観測データの “活かし方” Observe + Ability パフォーマンス問題の可視化 改善サイクルの加速 障害対応/トラブルシューティング の高速化 体験データを起点にした 迅速なマーケティング戦略 Datadog の Datadog によって創出される価値の例
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで~ • Datadog における 4 つの観測データの “活かし方” • まとめ
オブザーバビリティ = Observe(観測) + Ability(活用) 情報を “容易に” 確認でき、次のアクションへ “素早く” 繋げられること
UI を持つ現代アーキテクチャではユーザー体験がより重要視され、 バックエンドだけでなくフロントエンドの監視も必要 本日お話しした内容まとめ Datadog では、フロントエンド含む多種多様な情報が取得でき、 直感的な UI や相関付いたデータから “活用” に繋げることができる
Thank you ご清聴ありがとうございました