Slide 30
Slide 30 text
救世主HAGIHARA からSRE について僕が学んだこと
● 自動化しなくてもToil は減らせる
○ コードで自動化する実装の時間がとれなくとも、
実施頻度削減から着手するだけで大幅に負荷が軽減される
● モニタリングとアラートを正しく活用
○ 推測するな、計測せよ
○ 不要なアラートや、過剰なアラートは抹殺する
● SLI を策定し、サービス状態を正しく把握せよ
○ なんか◯◯なんだけど大丈夫なん?
➔「大丈夫です。社内のネットワークが遅いだけです」とちゃんと言える。