Slide 50
Slide 50 text
50
SREの課題が多くあるサービス開発チームの見つけ方
1. 信頼性に関わる重大な問題が溜まっているサービスを探す
a. 案: 問題管理(ITIL, 恒久対策タスク)からSeverity Levelの高い未解決タスク数を計測する
2. サービスの重要度から探す
3. 計測結果から探す
a. SLO違反数
b. バーンレートアラート数
c. Error budgetの低下
d. インシデント発生数
e. デプロイ数
f. お客様からの問い合わせ数
g. 性能低下傾向やエラー数を見る
h. etc
4. サーベイで見つける
画像は現在作成中のDatadog「SRE課題計測」ダッシュボード
(試せていないけど、インシデントとPostmortemの管理をDatadogに移行すれば、そのまま課題計測ダッシュボードに使えそう)