Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
はじめてのDatadog
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
KairiM
May 31, 2026
Technology
300
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
はじめてのDatadog
JDDUG琉球での登壇資料です
KairiM
May 31, 2026
More Decks by KairiM
See All by KairiM
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
140
Other Decks in Technology
See All in Technology
日本 Fintech 未来予測レポート 2027〜2028年(手動編集版)
8maki
0
2.2k
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
940
気づかぬうちにセキュリティ負債を生むAPIキー運用
sgwrmctk
0
120
AIのReact習熟度を測る
uhyo
2
340
RSA暗号を手計算したくなること、ありますよね?? (20260615_orestudy6_rsa)
thousanda
0
340
SONiCのLinuxベースを活かしたZabbix監視
sonic
0
110
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
930
作って終わりにしない タイミーのセマンティックレイヤー育成の現在地
chanyou0311
4
2.3k
2026 TECHFRESH 畢業分享會 - 開發日常大解密!從領域驅動到企業級上線
line_developers_tw
PRO
0
930
AGENTS.mdとSkillsで始めるAIエージェント活用
sonoda_mj
3
210
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
1
150
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
920
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
56k
Site-Speed That Sticks
csswizardry
13
1.2k
The Spectacular Lies of Maps
axbom
PRO
1
800
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Odyssey Design
rkendrick25
PRO
2
690
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Leo the Paperboy
mayatellez
7
1.8k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
480
Side Projects
sachag
455
43k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
360
The agentic SEO stack - context over prompts
schlessera
0
820
Transcript
はじめてのDatadog AI開発とオブザーバビリティ 1
丸山 海理 所属 役職 出身地 出身校 趣味 好きなAWS サービス SNS
(株)サンエー 情報システム部 課長 京都府 琉球大学 法文学部 経済 スポーツ観戦(サッカー/野球) KIRO cli @KairiM0kinawa 2
基幹システムを内製開発 技術スタック 2026 Main Architecture Layers Design & Frontend API &
Backend Database & Auth Data Analytics Infrastructure DevEx & Observability AI-Driven-DX Quality &Tools Ops & Collab 3
すべてのプログラムを コントロール出来ていますか? 迫る期限、品質の担保、予算や技術の課題。バイ ブで生まれたブラックボックスのコード。実際の 開発現場ではすべてのプログラムを完璧な状態に保 つのはなかなか難しい。 4
品質の低下 → チームの疲弊・・・ 解決できない 4XX / 5XX エラー・・・ 突然のレイテンシー悪化・・・ UI/UXに関するクレーム・・
未知の未知・・ 5
Datadog で解決しよう!! オブザーバビリティツールであるDatadogを活用し 正しく・素早く問題を解決。ユーザー体験を良く して信頼性を勝ち取ろう!! 6
Datadog を使うモチベーション Serverless Architecture 今までのようにサーバーのCPUやメモ リの使用量、ロードアベレージだけで は問題解決に至らない・・・ Multi Account or
Cloud 大量のアカウントをまたいで、ログを 見に行くのは大変。マルチクラウドな らなおさら・・・ 運用負荷軽減 もちろん左記をOSSで対応することは 可能かもだが・・・一定の技術力が必 要。またOSSの運用負荷もある。 7
オブザーバビリティとは? 観測可能性とは、システムの外部出力に関する知 識から、その内部状態をどの程度正確に推測でき るかを示す尺度である 出典:CNCF Observability White Paper https://github.com/cncf/tag-observability/blob/main/whitepaper.md#what-is-observability System
Output Metrics Logs Traces Profiles infer 内部を推測 8
Datadog APM(Application Performance Monitoring) 9
↑様々なタグで フィルタリング ←Tracesの情報は Flame Graph や Waterfallな ど様々な見方が可能 Lambdaのコールドスタート 等も把握
←MetricsやLogsもタブの切替 だけで一元管理 10
APMで見れるもの・出来ること ↓Profiles では関数内のどの処理がメモリを使っているかまで把握 11
これからは、Bits アシスタントに聞くだけでいいかも ↓かなりの精度でAIが質問に答えてくれる 12
再現不可・迷宮入りを回避する ユーザーからの報告を受けて、エラーの状況を再 現しようとしても、全く再現せず迷宮入りするケー スはないですか? 13
RUM(Real User Monitoring) ユーザーの動きを可視化する!! 14
実際に・・・ 自分のローカル環境でどれだけ再現しよう としても再現できなかった、動作がRUM のセッションリプレイをみて解決。 15
生成AI時代の開発 Code Developer GenAI Code Code 生成AIによりコードのアプトプットは増加 16
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
それらを捌くCI/CDが重要 17
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
レビューの待ちやPipeline自体の遅延が発生するケースも 18
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
PipelineもDatadogでO11Y出来る = CI Visibility 19
詳しい話は今日参加している賢者にお任せ 20
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
おざなりにすると予期せぬバグが混入 21
生成AI時代の開発 Code Review Build TEST Deploy Developer GenAI Code Code
だからこそのO11Y、だからこそのDatadog !! 22
実際に・・・ ↑もともと3並行でAPIが叩かれすぐに終わるはず処理が ↑AIによって直列に書き換えられていた・・・・ がTraceで発見!! 23
す べての情報を活用したAI活用 System post-mortem MD DatadogのMCPを使って目指せ一発解決! MCP IaC 24
実際にMCPで調査・修正・確認を行ってみた 1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 16 17 18 19 20 21 ## デプロイ前後の比較 | | 旧バージョン (2026.03.16.1135) | 新バージョン (2026.03.18.1148) | |---|---|---| | 直近15分のログ総数 | 1,660 | 2,297 | | DD_EXTENSION エラー | 8件 | 2件 | | エラー率 | 0.48% | 0.087% | 新バージョンでのエラーは logout 関数の1回分(2行で1セット)のみ です。 ## 評価 大幅に改善しています。旧バージョンでは全関数で満遍なく発生していたのが、新バージョンでは logout の み1件 に激減しました。 logout で残っている理由は、Okta への refresh token revocation がタイムアウトしている問題(別件のエ ラー)と関連している可能性があります。Okta 側のタイムアウトで Lambda の実行時間が長引き、Extension のフラッシュタイミングに影響しているケースです。 もう少し時間が経って全 Lambda が新バージョンに切り替わったら、ほぼゼロに近づくと思います。30分後く らいにもう一度確認しますか? 25
まとめ 26
・Datadogの機能を使って、自分のサービスの中身を知ろう! APMを駆使することで、バックエンドの課題を発見 RUMでユーザーの振舞いを可視化 ・AI開発時代のO11Y 生成AIによる非破壊的な変更をすぐにキャッチ MCPを使えば、原因の切り分け、対策、経過観察までお任せ ・O11Yを推進する設計や組織論 課題を発見した後、チームとして対応できるのか? アーキテクチャーとしても対応可能か? 27