Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
観測から行動へ Datadog で実現する"活きる"オブザーバビリティ
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Shuntaro Azuma
December 17, 2025
Technology
17
0
Share
観測から行動へ Datadog で実現する"活きる"オブザーバビリティ
Datadog Live Tokyo 2025 12 月の登壇資料になります。
https://www.event-site.info/datadog-live-tokyo-2025/
Shuntaro Azuma
December 17, 2025
More Decks by Shuntaro Azuma
See All by Shuntaro Azuma
AI 時代の個人趣味開発 と Google Cloud
a2ush
0
23
Datadog で実現するセキュリティ対策 ~オブザーバビリティとセキュリティを 一緒にやると何がいいのか~
a2ush
0
220
AI 駆動開発と Datadog
a2ush
0
93
kubelet は俺の上司。今日もコンテナを作る。
a2ush
0
100
Other Decks in Technology
See All in Technology
long-running-tasks
cipepser
2
450
管理アカウント単一運用からAWS Organizationsに移行するの大変で滅
hiramax
0
340
JJUG CCC 2026 Spring AI時代の開発こそ標準化を武器に! ― 方式・プロセス・プラットフォームの標準化
s27watanabe
2
640
サプライチェーンセキュリティの空白地帯 - 信頼できる”依存性”の未来を考える
rung
PRO
2
530
A Harness for Behaviour: how to get AI to generate code that does what we intend, or "TDD in the age of AI"
xpmatteo
1
520
TROCCOで始めるクラウドコストを民主化するためのFinOps
tk3fftk
2
490
GoとSIMDとWasmの今。
askua
1
120
OpenID Connectによるサービス間連携
takesection
0
150
イベントストーミングとKiroの仕様駆動開発で実現する要件の認識合わせプロセス
syobochim
7
980
権限管理設計を完全に理解した
rsugi
2
240
Databricks 月刊サービスアップデート 2026年05月号
tyosi1212
0
120
Generative UI × A2UI で AI エージェントを作った話 AI-DLC も使ってみた!
kmiya84377
1
290
Featured
See All Featured
Writing Fast Ruby
sferik
630
63k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
520
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
200
New Earth Scene 8
popppiees
3
2.3k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
210
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
320
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
150
Transcript
観測から行動へ Datadogで実現する "活きる"オブザーバビリティ Datadog Sales Engineer Shuntaro Azuma / 東
峻太朗 Datadog Live Tokyo 2025 12 月 登壇資料
アジェンダ • オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと
4 つの観測データ ~フロントからバックエンドまで~ • Datadog における 4 つの観測データの “活かし方” • まとめ 本セッションの 目的 • 「データを観測し”活用できる”」とはどういうことなのかを理解する • Datadog ではどのように “活用できる” のか知っていただく 来場者参加型デモ デモ
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
オブザーバビリティ は属人化を排除します オブザーバビリティ によって MTTR(平均修復時間)を短縮できます オブザーバビリティ のおかげで システムの健全性が向上しました オブザーバビリティ とは何なのでしょうか
世の中の声
取得情報からシステムの状態を 推測・説明できる能力 = 活用できる能力 観測 能力 オブザーバビリティ( Observability) = Observe
+ Ability システムを運用する上で必要な 情報を取得でき 、 オブザーバビリティ とは 情報を “容易に” 確認でき、次のアクションへ “素早く” 繋げられること
ケーススタディ - 単一サーバ(モノリシックシステム) オブザーバビリティとは言い難い例 CPU 使用率メトリクスを確認し、 高負荷状態にあることが分かった サーバーにログインし、プロセスや ログを直接見て原因を推測できる Observe
+ Ability CPU使用率 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 オブザーバビリティと言える例 どのプロセスがメトリクス高騰に起因し、 そのプロセスはどんな処理をしているのか “素早く” 調査できる スペック増強すべきかプロセスの処理を 見直すべきなのか “容易に” 判断できる pid 1 pid 10 Observe + Ability
オブザーバビリティとは言い難い例 CPU 使用率メトリクスを確認し、 値が高かったことが分かった サーバーにログインし、プロセスや ログを直接見て原因を推測する Observe + Ability ケーススタディ
- 単一サーバ(モノリシックシステム) CPU使用率 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 オブザーバビリティと言える例 どのプロセスがメトリクス高騰に起因し、 そのプロセスはどんな処理をしているのか “素早く” 調査できる スペック増強すべきかプロセスの処理を 見直すべきなのか “容易に” 判断できる pid 1 pid 10 Observe + Ability オブザーバビリティ ツールには • 必要な情報が十分に収集できるか だけでなく • いかに簡単に活用できるか が求められる
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
直感的な UI で簡単に操作でき 相関付いたデータから瞬時に洞察が得られる Datadog という 1 つのプラットフォームで 多種多様な情報が取得できる Datadog
の Observe + Ability Observe + Ability 観測 能力
それぞれが独立して稼働するサーバ群の中から 高負荷状態にあるサーバを 1 台特定し、その原因を探ります ケーススタディ - 単一サーバ(モノリシックシステム) デモ 特に以下の観点でデモをご覧ください •
収集されたデータが Datadog UI 上でどう表現されているか • 画面の操作性はどうか • 複数のデータへのアクセスがどれほど容易に行えるか
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
単一サーバ(モノリシック)で運用していた時代と異なり、 アーキテクチャの分散化や外部連携の増加により、監視対象は多面化 現代システムの潮流 モノリシック vs マイクロサービス pid 1 pid 10
オブザーバビリティに取り組むにあたり、 何を Observe(観測) するといいのでしょうか モノリシック マイクロサービス App1 App2 App3 Observe + Ability の部分を考えます コンテナ サーバ サーバレス App1 App2 App3
一般的に メトリクス、ログ、トレース の 3 つ データを取得するのがいいと言われています 出典:CNCF Observability White Paper
現代システムにおける Observe(観測) メトリクス ログ 2025-12-16 xx:xx log 1 2025-12-16 yy:yy loglog 2025-12-16 zz:zz log 2 トレース / Main Handler Sub Call
現代システムにおける Observe(観測) メトリクス ログ 2025-12-16 xx:xx log 1 2025-12-16 yy:yy
loglog 2025-12-16 zz:zz log 2 トレース / Main Handler Sub Call これらは バックエンド の観測 バックエンドの観測だけでは “実際のユーザー体験 ” を捉えきれません システムを使っているユーザ(*) (*)モバイル端末 世帯保有率 97.4% 出典: 総務省 令和6年版情報通信白書
ケーススタディ - UI を持つマイクロサービス バックエンドの観測のみ フロント+バックエンドの観測 API の成功、サービス間の遅延、 内部エラーの調査は可能 トレース
トレース トレース ログ メトリクス UI 崩れや描画速度、エラーに遭遇した ユーザの画面操作再現 などは確認できない しかし..
ケーススタディ - UI を持つマイクロサービス バックエンドの観測のみ フロント+バックエンドの観測 API の成功、サービス間の遅延、 内部エラーの調査は可能 ユーザーが実際にどの画面で、どの操作中に
問題に直面したのかを特定可能 表示速度・操作感・レンダリングの状態など “体感性能”を数値で把握できる フロントのエラーとバックエンドの処理を 紐づけ、原因を端から端まで追跡できる トレース トレース トレース ログ メトリクス ユーザー体験
現代システムにおける Observe(観測) トレース トレース トレース ログ メトリクス ユーザー体験 メトリクス (インフラ)
ログ トレース ユーザー体験 + フロントエンド バックエンド そしてただ 4 つのデータを収集するだけでなく、 “活用” できて初めてオブザーバビリティ( Observe + Ability)
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで ~ • Datadog における 4 つの観測データの “活かし方” • まとめ
バックエンドからフロントまで一貫調査でき ユーザ行動・マーケティング分析も可能 バックエンドだけでなくフロントエンドに 関する情報ももちろん取得可能 Datadog と 4 つの観測データ Observe +
Ability 観測 能力
来場者皆様にマイクロサービスで構築されたデモサイトへアクセスしていただき、 発生したエラーを Datadog でどう調査するのか 画面操作がどのように Datadog で分析できるのか を確認します 来場者参加型デモ 1.
気に入ったステッカーをいくつか購入してみてください 2. 1 つのステッカーを大量購入(例: 100億個)してみてください ケーススタディ - UI を持つ現代システム 皆様に お願いしたいこと
エラー発生ユーザーの体験を起点に アプリ全体の挙動を追跡し原因を特定します 障害対応 デモンストレーション 1 「処理が遅い」の裏側で何が起きているかを 傾向分析からボトルネックの特定まで実施します パフォーマンス改善 2 行動データから利用パターンを把握し
プロダクト改善やマーケ施策に活用します ユーザー行動分析 3
フロントの Observe(観測) によって エラー発生時の実ユーザの行動履歴やコンバージョン率まで簡単に分析することができ バックエンドの Observe(観測)によって エラーの原因やパフォーマンス分析が瞬時に特定、フロントエンドと紐づけて確認できる Datadog における 4
つの観測データの “活かし方” Observe + Ability パフォーマンス問題の可視化 改善サイクルの加速 障害対応/トラブルシューティング の高速化 体験データを起点にした 迅速なマーケティング戦略 Datadog の Datadog によって創出される価値の例
• オブザーバビリティとは • Datadog で実現する “活きる” オブザーバビリティ • 現代システムと 4
つの観測データ ~フロントからバックエンドまで~ • Datadog における 4 つの観測データの “活かし方” • まとめ
オブザーバビリティ = Observe(観測) + Ability(活用) 情報を “容易に” 確認でき、次のアクションへ “素早く” 繋げられること
UI を持つ現代アーキテクチャではユーザー体験がより重要視され、 バックエンドだけでなくフロントエンドの監視も必要 本日お話しした内容まとめ Datadog では、フロントエンド含む多種多様な情報が取得でき、 直感的な UI や相関付いたデータから “活用” に繋げることができる
Thank you ご清聴ありがとうございました