組織に対してSREを適用するとどうなるか

Slide 1

Slide 1 text

組織に対してSREを適用するとどうなるか SRE Lounge #14     國井匡生  

Slide 2

Slide 2 text

自己紹介名前: 國井匡生（くにいまさお）職業: データエンジニア　　　（元SREマネージャー）趣味: 子供にアジャイルを教えること

Slide 3

Slide 3 text

今日話すこと ● 組織の信頼性に対してSREを適用することについて ● 実際に組織に起きた問題とそれにどういうプラクティスを適用し、どうなったのか ※個人の見解であり、いかなる組織の意見を代表したものではありません

Slide 4

Slide 4 text

話さないこと ● コンピュータシステムに対するSREのプラクティス ● 一般的なチームビルディングやマネジメント的なこと

Slide 5

Slide 5 text

SRE NEXT 2022のおさらい

Slide 6

Slide 6 text

なぜ組織の話をするのか ● プロダクトはどこから生まれる？ ○ プロダクトを作るのも運用するのも人 ○ 大抵の場合、1人ではなく複数人の組織

Slide 7

Slide 7 text

なぜ組織の話をするのか信頼性とは “「［システムが］求められる機能を、定められた条件の下で、定められた期間にわたり、障害を起こすことなく実行する確率」“ Betsy Beyer; Chris Jones; Jennifer Petoff; Niall Richard Murphy. SRE サイトリライアビリティエンジニアリング (xiv). 求められる機能 = プロダクトを作り、提供し、運用する定められた条件 = プロダクトの提供が続く限り定められた期間 = プロダクトの使命を果たすまで障害 = プロダクト開発、運用ができない状態になる

Slide 8

Slide 8 text

なぜ組織の話をするのか ● 信頼性の低い組織から信頼性の高いプロダクトが生まれるだろうかプロダクト開発、運用ができない状態になりがちな組織が高い品質を担保できる状態になることは考えにくい

Slide 9

Slide 9 text

SREのおさらい “SREとは、ソフトウェアエンジニアに運用チームの設計を依頼したときにできあがるもの” Betsy Beyer; Chris Jones; Jennifer Petoff; Niall Richard Murphy. SRE サイトリライアビリティエンジニアリング (p.5). 運用ではなく、運用チームの話

Slide 10

Slide 10 text

組織をコンピュータシステムと捉える “実際のところ、ソフトウエア開発上の問題の多くは、技術的というより社会学的なものである。” トムデマルコ；ティモシーリスター. ピープルウエア　第 3版 (p.28). ソフトウェアを作るのも運用するのもピープルウェア

Slide 11

Slide 11 text

組織をコンピュータシステムと捉える “人間は不完全なマシンです。人間は退屈し、十分には理解されていないプロセッサ（場合によってはUIも）を持ち、あまり効率も良くありません” Betsy Beyer; Chris Jones; Jennifer Petoff; Niall Richard Murphy. SRE サイトリライアビリティエンジニアリング (p.431). 組織は人、しかし、人をコンピュータとして捉えたとき、信頼性はとても低い ● 期待した動作をさせるのは困難 ● 人には人生があり、ずっとそこにいるとは限らない

Slide 12