Slide 3
Slide 3 text
SREとは
Site Reliability Engineering の略。
ソフトウェアエンジニアリングを活用し、システムの信頼性を向上させること。
具体的には...
SLI/SLOの定義と計測:サービス品質の指標(SLI)を定め、その目標値(SLO)の達成状況を監
視し、サービスの安定稼働と信頼性向上の実現
トイル削減と自動化:運用上の手作業(トイル)を徹底的に自動化し、エンジニアの生産性を向
上。
継続的な改善:障害発生時に原因を分析し、
「ポストモーテム」を通じて再発防止とサービス改
善を推進。
...etc
※他にも、SREはサービスの状況によってやることは変わっていくのが多いです。