Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Datadog による 自己完結的アプリケーションモニタリング
Search
Recruit
PRO
March 13, 2024
Technology
6
1.7k
Datadog による 自己完結的アプリケーションモニタリング
2024/03/13に、Japan Datadog User Group Meetup#3で発表した、小檜山の資料です。
Recruit
PRO
March 13, 2024
Tweet
Share
More Decks by Recruit
See All by Recruit
事業の財務責任に向き合うリクルートデータプラットフォームのFinOps
recruitengineers
PRO
2
430
AI-DLCを現場にインストールしてみた:プロトタイプ開発で分かったこと・やめたこと
recruitengineers
PRO
2
610
プロダクトマネジメントの分業が生む「デリバリーの渋滞」を解消するTPMの越境
recruitengineers
PRO
4
1.1k
あなたの知らない Linuxカーネル脆弱性の世界
recruitengineers
PRO
4
430
dbtとBigQuery MLで実現する リクルートの営業支援基盤のモデル開発と保守運用
recruitengineers
PRO
5
310
『ホットペッパービューティー』のiOSアプリをUIKitからSwiftUIへ段階的に移行するためにやったこと
recruitengineers
PRO
4
1.9k
経営の意思決定を加速する 「事業KPIダッシュボード」構築の全貌
recruitengineers
PRO
4
500
Browser
recruitengineers
PRO
12
4.3k
JavaScript 研修
recruitengineers
PRO
9
2.4k
Other Decks in Technology
See All in Technology
データの整合性を保ちたいだけなんだ
shoheimitani
8
3k
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
3.8k
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1k
SREじゃなかった僕らがenablingを通じて「SRE実践者」になるまでのリアル / SRE Kaigi 2026
aeonpeople
6
2.2k
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.5k
Embedded SREの終わりを設計する 「なんとなく」から計画的な自立支援へ
sansantech
PRO
3
2.2k
OWASP Top 10:2025 リリースと 少しの日本語化にまつわる裏話
okdt
PRO
2
310
Introduction to Bill One Development Engineer
sansan33
PRO
0
360
GSIが複数キー対応したことで、俺達はいったい何が嬉しいのか?
smt7174
3
150
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
340
Featured
See All Featured
Designing Powerful Visuals for Engaging Learning
tmiket
0
220
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
310
Fireside Chat
paigeccino
41
3.8k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
320
Rails Girls Zürich Keynote
gr2m
96
14k
Building the Perfect Custom Keyboard
takai
2
680
Context Engineering - Making Every Token Count
addyosmani
9
650
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
120
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
300
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
sira's awesome portfolio website redesign presentation
elsirapls
0
140
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
110
Transcript
#JDDUG Datadog による自己完結的アプリケーションモニタリング Datadog による 自己完結的アプリケーションモニタリング @mopp Japan Datadog User
Group Meetup#3
#JDDUG Datadog による自己完結的アプリケーションモニタリング Agenda | 00 01 03 04 About
me & us 自己完結的アプリケーションモニタリング Datadog 活用事例 まとめ
#JDDUG Datadog による自己完結的アプリケーションモニタリング About mopp • ミッション ◦ 技術的負債の解消 •
エディタ ◦ NeoVim • 好きな言語 ◦ C, Erlang/OTP • 最近ハマっていること ◦ 玉ねぎを飴色にすること
#JDDUG Datadog による自己完結的アプリケーションモニタリング About スタディサプリ 小中高 様々なスタディサプリの内 小中高向けのスタディサプリの お話をします
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリング 01
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的とは? 必要なものを必要なときに自分たちで用意できること
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的とは? • 弊組織の SRE により推進されています • 具体的には、設計、実装、QA、デプロイ、監視などの全てを
一貫してチームで行うこと • 今日は「監視」のための Datadog 利用事例を紹介します
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングとは? • チームで ◦ 問題なく動作しているか?を知ることができる ◦ メトリクスやグラフなどを必要なときに追加できる
◦ 異常を即座に検知できる • 監視が出来ているってなに? ◦ 何が、どこで、どのくらい起きているか、を知ることができる
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために こういうこと、ありがちですよね? 「要件も6割くらいが完了して順調だな〜 そろそろ Dashboard でも作ろうかな」
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために Dashboard は初期から作ろう
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために • 監視はアプリケーションと一緒に作っていこう ◦ 犬と共に歩んでください • そのために監視設定もタスクに入れてしまう
◦ Sprint Planning や Task Refinement で入れてしまう ◦ PR で一緒に追加、レビューで指摘する
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために • 監視も一緒に作るための Code - Test -
Monitor ステップ ◦ Code ▪ プロダクションコードとテストコードを書く ◦ Test ▪ 実際にアプリケーションを起動して動作確認する ◦ Monitor 🆕 ▪ 監視項目を追加する
#JDDUG Datadog による自己完結的アプリケーションモニタリング Datadog 活用事例 02
#JDDUG Datadog による自己完結的アプリケーションモニタリング 弊組織での Datadog 普及の道のり • Dashboard から利用が始まる •
SLO という概念の導入が推進される ◦ 各サービスに Monitor と SLO が設定される • APM が導入&推進される • 有識者が Notebook を使いこなし便利過ぎるとじわじわ話題に ※mopp 視点なので事実と異なる可能性があります
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard を使い込む • Datadog の基本は Dashboard だと考えています
◦ 日頃一番見るから ◦ 他の機能と連携するとより便利になるから ▪ SLO, Monitor, APM, Events など ◦ 何かあったときに見に行くから
#JDDUG Datadog による自己完結的アプリケーションモニタリング 使い込むために毎日見る • Daily Meeting で見てます ◦ 10分かからないくらい
• 異変を早めに検知するため ◦ 日頃の負荷の肌感をつけるため • Dashboard の土地勘をつけるため
#JDDUG Datadog による自己完結的アプリケーションモニタリング 使い込むために毎日見る • Kubernetes、SaaS、ドメイン固有の ものまで一つの Dashboard で見る ◦
ここを見ればこのサービスの 状態全てがわかる、が理想 • サービス1個につき1個の Dashboard ◦ 今は3つのサービスを見ている ◦ 4個以上だと大変なので 総合 Dashboard が欲しいかも
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: Percentile は基本 • p99, p90,
p50, avg あたりは基本なので見ましょう ◦ avg だけだとかなり当てにならない
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: しきい値を表示する • 例: t系なので CPU使用率が
20% を超えるなら見直しが必要 • Monitor でアラートするのも便利
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: 使用料金も見る • 最近、SRE によりAWS利用料金がサービス単位で可視化されました ◦
「うちらのサービス、思ったより高くね…?」となり改善に繋がる Text Widget で 説明が書いてあるのも易しくてよき 実は Powerpack 化されているので コピペですぐに使えて保守も簡単
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: 時間がないので箇条書き • Events のリストを表示する ◦
Kubernetes の Readiness Probe 失敗や OOM を見ている • Metrics Summary で何が表示できるか?を流し見する ◦ これ見たほうがいいかも、って案外なる ◦ Document のチェックも忘れずに • Pod数が多い CPU, Memory の使用量はヒートマップが便利
#JDDUG Datadog による自己完結的アプリケーションモニタリング custom metrics でバグ調査 • バグの調査に利用 if is_piyo_mismatch
# おかしいときの条件 tags = { user_id:, piyo_id:, platform:, browser:, version: } statsd.increment('hoge_namespace.piyo_mismatch.count', tags:) end • どのような状態か、頻度、発生時刻、などが Dashboard だと見やすい • たまにしか起きないバグ どのようなデータ分布なのかを調べたいとき、に便利 • NOTE: tags の組み合わせ数で課金されるので user_id を安直に入れるのは注意 ◦ 組織のメトリクス数が無限に増加し、請求に問題が発生します。
#JDDUG Datadog による自己完結的アプリケーションモニタリング monitor から Slack への通知 • サービスごとに専用の通知チャンネルを作成 ◦
チームだとサービス移譲のときに大変だし、混じって見づらい • 本番とそれ以外で分離 ◦ #hoge-service-prod-notifications ◦ #hoge-service-develop-notifications ◦ 初手のトリアージに便利 • チームにメンションをする ◦ IDを取るのが高難易度業務
#JDDUG Datadog による自己完結的アプリケーションモニタリング 培った Dashboard 力で調査する Notebook • グラフ弄りとメモ書きが同時にできる ◦
最高便利 • 共同編集もできる
#JDDUG Datadog による自己完結的アプリケーションモニタリング まとめ 03
#JDDUG Datadog による自己完結的アプリケーションモニタリング まとめ • 自分たちのアプリケーションは自分たちで手綱を握ろう • Code - Test
- Monitor で監視も共に育てよう • まずは Dashboard から使い尽くそう
#JDDUG Datadog による自己完結的アプリケーションモニタリング ご清聴ありがとうございました