Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Datadog による 自己完結的アプリケーションモニタリング
Search
Recruit
PRO
March 13, 2024
Technology
6
1.2k
Datadog による 自己完結的アプリケーションモニタリング
2024/03/13に、Japan Datadog User Group Meetup#3で発表した、小檜山の資料です。
Recruit
PRO
March 13, 2024
Tweet
Share
More Decks by Recruit
See All by Recruit
リクルート新人研修2024 テキスト生成AI活用
recruitengineers
PRO
10
420
リクルートのデータマネジメント組織に 求められてきたコト
recruitengineers
PRO
4
340
最短最速に魂を売る! 新しいアーキテクチャとプロセスの提案!
recruitengineers
PRO
5
89
プロデザ! BY リクルートvol.22_様々なプロダクト経験の中で活きたPdMのスキル
recruitengineers
PRO
3
170
JavaScript研修 (2024)
recruitengineers
PRO
7
3.5k
TypeScript入門 2024
recruitengineers
PRO
25
14k
React 研修 (2024)
recruitengineers
PRO
38
14k
Next.js 研修 2024
recruitengineers
PRO
12
2.2k
App Router入門 Next.js App Router@Recruit bootcamp2024
recruitengineers
PRO
14
1.4k
Other Decks in Technology
See All in Technology
チームが自己組織化してから敢えて専任スクラムマスターを置いてみたらめちゃめちゃワークした話 / How bringing in a Scrum Master to an already self-organized team totally worked out
hc0208
2
1.6k
株式会社M2X エンジニアチーム紹介資料
m2xsoftware
0
320
Azure SQL Database Hyperscale HA レプリカの監視
sansantech
PRO
0
190
Azure Cosmos DB での時系列ログの運用と改善
sansantech
PRO
0
190
なぜクラウドサービスで Web コンソールを提供するのか
shuta13
4
1.2k
New Relicで実践する外形監視
aeonpeople
1
120
LLMに日本語テキストを学習させる意義
ksaito
13
3.4k
【Λ(らむだ)最近のアプデ情報 / RPALT20240904
lambda
0
160
Dive Deep in Cloud Run: Automatic Base Image update
aoto
PRO
0
900
AWS版GitHub?Amazon CodeCatalystの全体像をまとめてみた
oshanqq
1
3.2k
エンジニア採用を起点に取り組む組織の改善活動と課題、中長期のタスク管理/ #HRmethod
nishiuma
4
3.3k
Javaにおける関数型プログラミンへの取り組み
skrb
4
110
Featured
See All Featured
Art, The Web, and Tiny UX
lynnandtonic
294
20k
The Language of Interfaces
destraynor
153
23k
Six Lessons from altMBA
skipperchong
26
3.3k
Pencils Down: Stop Designing & Start Developing
hursman
118
11k
Become a Pro
speakerdeck
PRO
22
4.8k
Writing Fast Ruby
sferik
623
60k
RailsConf 2023
tenderlove
26
790
We Have a Design System, Now What?
morganepeng
48
7.1k
Unsuck your backbone
ammeep
667
57k
GraphQLとの向き合い方2022年版
quramy
43
13k
Fashionably flexible responsive web design (full day workshop)
malarkey
400
65k
Fontdeck: Realign not Redesign
paulrobertlloyd
80
5.1k
Transcript
#JDDUG Datadog による自己完結的アプリケーションモニタリング Datadog による 自己完結的アプリケーションモニタリング @mopp Japan Datadog User
Group Meetup#3
#JDDUG Datadog による自己完結的アプリケーションモニタリング Agenda | 00 01 03 04 About
me & us 自己完結的アプリケーションモニタリング Datadog 活用事例 まとめ
#JDDUG Datadog による自己完結的アプリケーションモニタリング About mopp • ミッション ◦ 技術的負債の解消 •
エディタ ◦ NeoVim • 好きな言語 ◦ C, Erlang/OTP • 最近ハマっていること ◦ 玉ねぎを飴色にすること
#JDDUG Datadog による自己完結的アプリケーションモニタリング About スタディサプリ 小中高 様々なスタディサプリの内 小中高向けのスタディサプリの お話をします
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリング 01
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的とは? 必要なものを必要なときに自分たちで用意できること
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的とは? • 弊組織の SRE により推進されています • 具体的には、設計、実装、QA、デプロイ、監視などの全てを
一貫してチームで行うこと • 今日は「監視」のための Datadog 利用事例を紹介します
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングとは? • チームで ◦ 問題なく動作しているか?を知ることができる ◦ メトリクスやグラフなどを必要なときに追加できる
◦ 異常を即座に検知できる • 監視が出来ているってなに? ◦ 何が、どこで、どのくらい起きているか、を知ることができる
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために こういうこと、ありがちですよね? 「要件も6割くらいが完了して順調だな〜 そろそろ Dashboard でも作ろうかな」
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために Dashboard は初期から作ろう
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために • 監視はアプリケーションと一緒に作っていこう ◦ 犬と共に歩んでください • そのために監視設定もタスクに入れてしまう
◦ Sprint Planning や Task Refinement で入れてしまう ◦ PR で一緒に追加、レビューで指摘する
#JDDUG Datadog による自己完結的アプリケーションモニタリング 自己完結的アプリケーションモニタリングのために • 監視も一緒に作るための Code - Test -
Monitor ステップ ◦ Code ▪ プロダクションコードとテストコードを書く ◦ Test ▪ 実際にアプリケーションを起動して動作確認する ◦ Monitor 🆕 ▪ 監視項目を追加する
#JDDUG Datadog による自己完結的アプリケーションモニタリング Datadog 活用事例 02
#JDDUG Datadog による自己完結的アプリケーションモニタリング 弊組織での Datadog 普及の道のり • Dashboard から利用が始まる •
SLO という概念の導入が推進される ◦ 各サービスに Monitor と SLO が設定される • APM が導入&推進される • 有識者が Notebook を使いこなし便利過ぎるとじわじわ話題に ※mopp 視点なので事実と異なる可能性があります
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard を使い込む • Datadog の基本は Dashboard だと考えています
◦ 日頃一番見るから ◦ 他の機能と連携するとより便利になるから ▪ SLO, Monitor, APM, Events など ◦ 何かあったときに見に行くから
#JDDUG Datadog による自己完結的アプリケーションモニタリング 使い込むために毎日見る • Daily Meeting で見てます ◦ 10分かからないくらい
• 異変を早めに検知するため ◦ 日頃の負荷の肌感をつけるため • Dashboard の土地勘をつけるため
#JDDUG Datadog による自己完結的アプリケーションモニタリング 使い込むために毎日見る • Kubernetes、SaaS、ドメイン固有の ものまで一つの Dashboard で見る ◦
ここを見ればこのサービスの 状態全てがわかる、が理想 • サービス1個につき1個の Dashboard ◦ 今は3つのサービスを見ている ◦ 4個以上だと大変なので 総合 Dashboard が欲しいかも
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: Percentile は基本 • p99, p90,
p50, avg あたりは基本なので見ましょう ◦ avg だけだとかなり当てにならない
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: しきい値を表示する • 例: t系なので CPU使用率が
20% を超えるなら見直しが必要 • Monitor でアラートするのも便利
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: 使用料金も見る • 最近、SRE によりAWS利用料金がサービス単位で可視化されました ◦
「うちらのサービス、思ったより高くね…?」となり改善に繋がる Text Widget で 説明が書いてあるのも易しくてよき 実は Powerpack 化されているので コピペですぐに使えて保守も簡単
#JDDUG Datadog による自己完結的アプリケーションモニタリング Dashboard Tips: 時間がないので箇条書き • Events のリストを表示する ◦
Kubernetes の Readiness Probe 失敗や OOM を見ている • Metrics Summary で何が表示できるか?を流し見する ◦ これ見たほうがいいかも、って案外なる ◦ Document のチェックも忘れずに • Pod数が多い CPU, Memory の使用量はヒートマップが便利
#JDDUG Datadog による自己完結的アプリケーションモニタリング custom metrics でバグ調査 • バグの調査に利用 if is_piyo_mismatch
# おかしいときの条件 tags = { user_id:, piyo_id:, platform:, browser:, version: } statsd.increment('hoge_namespace.piyo_mismatch.count', tags:) end • どのような状態か、頻度、発生時刻、などが Dashboard だと見やすい • たまにしか起きないバグ どのようなデータ分布なのかを調べたいとき、に便利 • NOTE: tags の組み合わせ数で課金されるので user_id を安直に入れるのは注意 ◦ 組織のメトリクス数が無限に増加し、請求に問題が発生します。
#JDDUG Datadog による自己完結的アプリケーションモニタリング monitor から Slack への通知 • サービスごとに専用の通知チャンネルを作成 ◦
チームだとサービス移譲のときに大変だし、混じって見づらい • 本番とそれ以外で分離 ◦ #hoge-service-prod-notifications ◦ #hoge-service-develop-notifications ◦ 初手のトリアージに便利 • チームにメンションをする ◦ IDを取るのが高難易度業務
#JDDUG Datadog による自己完結的アプリケーションモニタリング 培った Dashboard 力で調査する Notebook • グラフ弄りとメモ書きが同時にできる ◦
最高便利 • 共同編集もできる
#JDDUG Datadog による自己完結的アプリケーションモニタリング まとめ 03
#JDDUG Datadog による自己完結的アプリケーションモニタリング まとめ • 自分たちのアプリケーションは自分たちで手綱を握ろう • Code - Test
- Monitor で監視も共に育てよう • まずは Dashboard から使い尽くそう
#JDDUG Datadog による自己完結的アプリケーションモニタリング ご清聴ありがとうございました