https://www.usenix.org/publications/loginonline/evolution-sre-google
https://www.jasa.or.jp/lists/anzen-seminar_2-18_2-25/
本講演では、Google をはじめとする大規模システムの運用現場で実践されている SRE (Site Reliability Engineering) の考え方を題材に、STAMP/STPA に代表されるシステム理論に基づく安全分析手法との関係を解説します。SRE は Web システムの信頼性を定量的に扱い、継続的に改善する実践的アプローチです。一方でその背景には、複雑な Web システムを前提とした考え方があります。SRE が直面する課題や限界を整理したうえで、STAMP/STPA がどのように想定外の障害や事故に気づくための視点を与えるのかを Google の SRE が公開している事例をもとにご紹介します。