Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Expanding SRE ~方法論としてのSREを広めたい~

Annosuke Yokoo
September 20, 2023

Expanding SRE ~方法論としてのSREを広めたい~

Annosuke Yokoo

September 20, 2023
Tweet

More Decks by Annosuke Yokoo

Other Decks in Technology

Transcript

  1. Copyrights©3-shake Inc. All Rights Reserved. 2 SaaS企業でWebアプリケーション開発や企業向けパブリッククラウド構築支 援を経験したのち、現在株式会社スリーシェイクでSREをやってます。 CNCF関連の技術や、SREの実践を勉強するのが好きです。 (2023

    AWS All Certifications Engineer / 2023 AWS Jr.Champion / Jagu'e'r - CloudNative分科会運営) 【格言・座右の銘】   迷ったらやる! Annosuke Yokoo (@866mfs) 株式会社スリーシェイク Sreake 事業部 Who am I
  2. Copyrights©3-shake Inc. All Rights Reserved. 3 SREの「2つ」の定義 SiteReliabilityEngineering(SRE) - 「方法論」としてのSRE

     👉 考え方・文化 - SREの「Why」 - サイトの信頼性向上を目的としたエンジニアリング手法 SiteReliabilityEngineer(SRE) - 「職務(ロール)」としてのSRE - SREの「How」 - 「ソフトウェアエンジニア50%・特定分野のスペシャリスト50%」が良いと言われてはいるが ...(?) https://speakerdeck.com/fujisaki_hb/site-reliability-engineeringtoha?slide=7 ⏩ ソフトウェアエンジニアに運用チームの設計を依頼したときにできあがるもの
  3. Copyrights©3-shake Inc. All Rights Reserved. 5 ロールから方法論への抽象化 “ SRE 運用の一般的な領域に影響を与えるパターン、行動、関

    心領域について、次の項目が挙げられる。 “ 1. Embracing Risk (リスクの許容) 2. Service Level Objectives (SLO) 3. Elimination Toil (Toil の撲滅) 4. Monitoring Distributed Systems (分散システムの監視 ) 5. Evolution of Automation (自動化の促進) 6. Release Engineering 7. Simplicity SRE サイトリライアビリティエンジニアリング https://www.oreilly.co.jp/books/9784873119618/
  4. Copyrights©3-shake Inc. All Rights Reserved. 6 ロールから方法論への抽象化 いきなり、方法論としてのSREなんて言われてもわからん 😇 ということでまずはロールを見てみる

    “ SRE 運用の一般的な領域に影響を与えるパターン、行動、関心 領域について、次の項目が挙げられる。 “ 1. Embracing Risk (リスクの許容) 2. Service Level Objectives (SLO) 3. Elimination Toil (Toil の撲滅) 4. Monitoring Distributed Systems (分散システムの監視) 5. Evolution of Automation (自動化の促進) 6. Release Engineering 7. Simplicity SRE サイトリライアビリティエンジニアリング https://www.oreilly.co.jp/books/9784873119618/ これらを抽象化した「考え方」が方法論としてのSRE
  5. Copyrights©3-shake Inc. All Rights Reserved. 7 何のためのSREか? “ SREの重要な価値は4つ(組織によって表現の仕方が多少異なるか相対的な優先 順位が異なる)“

    • サイトの稼働の維持 • 開発チームが「正しいことを行う」環境の整備 /意思決定の分散化 • エンジニアリングの問題としての運用へのアプローチ • 約束の表明、計測、実現を通じた ビジネスの成功の達成 “ SREが最も高い生産性と価値を示すのは、障害の防止や軽減に集中するときでは なく、ビジネスにおける成功の実現に集中するとき です。 部分を見ることから全体を見ることへ ......現在に対応することから将来を創造するこ とへという気持ちの変化 ” ⏩ SiteReliabilityEngineeringへの取り組みにはメンタルシフトが重要である SREの探求 https://www.oreilly.co.jp/books/9784873119618/
  6. Copyrights©3-shake Inc. All Rights Reserved. 8 SREの在り方 「内」にも「外」にも最も全体最適を考えられる存在 (内:DveからBizまで /

    外:User) Biz上位層の人ほど「SiteReliabilityEngineering」 という考え方・文化を、 認知・理解する必要がある 👉 SRE チームの役割を明確にして理解を得る SRE は SRE チームだけで成立するものではありません 。 他チームとの協働があってこそ成立するものです。そのためにも SRE の 役割を明確にして有機的に協働する必要があります。 また、Google の SRE のカタチに囚われすぎない事も大事です。 Biz Dev SRE
  7. Copyrights©3-shake Inc. All Rights Reserved. 9 Your own SRE ・あなたらしくSRE(同僚の資料から引用)

    Googleのとあるソフトウェアエンジニアがシステム運用を任されて、長い時間を かけて理想を形にした結果がSREである。 現在サービスを運用する上で最適だと言われる 方法論の一つとしてSREがあり SREの本の状態を目指すことが真のゴールではない。 SREのプラクティスを自分たちなりに解釈して、組織やサービスと向き合い続け て、仲間を集めた先に、あなた(の組織)らしいSREが生まれるのです。 SREの探求 https://www.oreilly.co.jp/books/9784873119618/ https://speakerdeck.com/abnoumaru/anatarasikusre-gong-kai-yong