Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
o11yツールを乗り換えた話
Search
tak0x00
August 08, 2025
Technology
2
2.8k
o11yツールを乗り換えた話
tak0x00
August 08, 2025
Tweet
Share
More Decks by tak0x00
See All by tak0x00
CDNのログでLPの可観測性を高めた話
tak0x00
1
190
Other Decks in Technology
See All in Technology
今日から始めるAmazon Bedrock AgentCore
har1101
4
420
生成AIと余白 〜開発スピードが向上した今、何に向き合う?〜
kakehashi
PRO
0
160
OWASP Top 10:2025 リリースと 少しの日本語化にまつわる裏話
okdt
PRO
3
850
20260204_Midosuji_Tech
takuyay0ne
1
160
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
350
Kiro IDEのドキュメントを全部読んだので地味だけどちょっと嬉しい機能を紹介する
khmoryz
0
210
Bedrock PolicyでAmazon Bedrock Guardrails利用を強制してみた
yuu551
0
260
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
12
5.6k
AWS DevOps Agent x ECS on Fargate検証 / AWS DevOps Agent x ECS on Fargate
kinunori
2
180
20260208_第66回 コンピュータビジョン勉強会
keiichiito1978
0
200
AIエージェントを開発しよう!-AgentCore活用の勘所-
yukiogawa
0
190
ブロックテーマ、WordPress でウェブサイトをつくるということ / 2026.02.07 Gifu WordPress Meetup
torounit
0
200
Featured
See All Featured
Rails Girls Zürich Keynote
gr2m
96
14k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Deep Space Network (abreviated)
tonyrice
0
65
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Thoughts on Productivity
jonyablonski
74
5k
Heart Work Chapter 1 - Part 1
lfama
PRO
5
35k
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
200
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
110
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.2k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
170
Transcript
o11yツールを乗り換えた話 福本隆弘 (tak_0x00 )
自己紹介 名前: 福本 隆弘 Twitter (X): @tak_0x00 (趣味垢) 所属: 某リユース事業の会社の
SRE
今日の話は? o11yツールを乗り換えた話 - 何を目的として乗り換えたのか - 乗り換えするときに認識すべき事項 - 乗り換え作業前後のあれやこれや どちらが良い悪いという話ではなく、選択のポイントと移行準備の話です!
対象となったシステム - AWS/EC2で動作するLAMPで構成されたシステム - APサーバ(PHP環境)は10-100台で変動 - Datadogを用いたo11y環境を構築
どうして移行するに至ったのか - コスト - 全台モニタリングする環境を整えようとしたら費用がすごかった - EC2の台数変動が10~50台と幅広く、予算ブレがすごい - APMが導入できない -
詳細なパフォーマンス分析のために APMを導入したかった - 環境がそれなりに古かったため、 php moduleがインストールできない - 半年以上格闘したが、どうにか入れても seg faultで落ちる...
どうして移行するに至ったのか - コスト - 全台モニタリングする環境を整えようとしたら費用がすごかった →NewRelicならアカウント数依存 (ダッシュボード閲覧なら Free Userで可) -
APMが導入できない - 詳細なパフォーマンス分析のために APMを導入したかった →NewRelic APMを試験導入したところ問題なく動作した
どうして移行するに至ったのか - コスト - 全台モニタリングする環境を整えようとしたら費用がすごかった →NewRelicならアカウント数依存 (ダッシュボード閲覧なら Free Userで可) -
APMが導入できない - 詳細なパフォーマンス分析のために APMを導入したかった →NewRelic APMを試験導入したところ問題なく動作した Full Platformが必要なはずの APMもダッシュボード化すると閲 覧できた(当時) 元々OTELやdd-agentが導入され ておらず、完全新規導入なため 任意の選択を行いやすい状態
移行戦略を考える 試用期間 併用/切り替え準備 完全切り替え
移行戦略を考える -試用期間 試用期間 併用/切り替え準備 完全切り替え - SRE側作業 - 一部のサーバをAutoScalingグループから外し、手動で NewRelic環境を設定
- APMや各種メトリクス送信のチェック - 環境変更に伴う負荷増加やクラッシュが無いかチェック - エンジニア向けNewRelicダッシュボードの作成
移行戦略を考える -併用期間 試用期間 併用/切り替え準備 完全切り替え - SRE側作業 - NewRelic/Datadog両方をセットアップした EC2イメージに切り替え
- NewRelicのデータ使用量が想定通りかチェック - エンジニア側作業 - NewRelicの使用感確認・Datadogとの差についてSREにフィードバック
移行戦略を考える -切替完了へ向けて 併用・切り替え準備 試用期間 完全切り替え - SRE側作業 - NewRelicのみをセットアップした EC2イメージに切り替え
- エンジニア側作業 - 各種振り返り資料などの Datadogダッシュボードのキャプチャ取得 - 各ドキュメントのリンク修正
移行戦略のポイント - Datadogと同じ構成のダッシュボード を作成し、提供 - 「せっかく覚えた見方、また覚え直し?」の低減 - 単プロダクトだったため、ダッシュボード自体の枚数が少なかったことも大きい - 並行期間を充分に設ける(今回は3ヶ月ほど)
- 丸め誤差による表現の差など、 DatadogとNewRelicの差を実感・認識 してもらう - Datadog時代のキャプチャの取得 ・確保
移行してどうでした? - 予算 - (同条件だと)以前より安価に。安心して使えるようになった - 契約容量を超過する利用をしても、 2~3ヶ月以内に容量削減するか再契約するかを選択できる - o11y環境として
- APM/RUM導入により実環境でのパフォーマンスチェックが可能となった - サンプリングではなく、全台のモニタリングが可能となった - やや使い勝手は悪くなった - グラフ表現の多様性が低い - Full Platform/Basic Userの切り替えが面倒 - (当時)日中帯に破壊的UI変更があることが多く安定しない - (慣れるまで)NRQLがとっかかりづらい
移行してどうでした? - 予算 - (同条件だと)以前より安価に。安心して使えるようになった - 契約容量を超過する利用をしても、 2~3ヶ月以内に容量削減するか再契約するかを選択できる - o11y環境として
- APM/RUM導入により実環境でのパフォーマンスチェックが可能となった - サンプリングではなく、全台のモニタリングが可能となった - やや使い勝手は悪くなった - グラフ表現の多様性が低い - Full Platform/Basic Userの切り替えが面倒 - (当時)日中帯に破壊的UI変更があることが多く安定しない - (慣れるまで)NRQLがとっかかりづらい とはいえ、 見れないツールより見れるツール
まとめ -o11yツールを乗り換えてみたよ - - 課金体系・サポート対象のフレームワークなどに不満があり乗り換えた - 移行に際していくつかの施策を実施し、スムーズな移行をサポート - 並行期間を充分に設ける -
同じ体験を得られるダッシュボードの作成 - 各チームでやることの指示 - 無事に移行し、目的を達することができた
まとめ -o11yツールを乗り換えようとする時に考えること - 各プロダクトの相対評価を実施する - 課金体系の違い - ダッシュボード・グラフ表現の差 - 得意とするIaaSやサポートしているメトリクス・フレームワークの差
- (個人的には)NewRelicはAWSに、DataDogはGCPに強い印象 - 数ヶ月程度の並行期間を設ける - 実際の使用感をSRE以外でも確かめる - 旧ツールでの指標データの確保 を実施する - 新旧両方のツールで同時間の指標を取得し、 読み替えができる ようにする