Upgrade to Pro — share decks privately, control downloads, hide ads and more …

超入門 SRE

ryuichi1208
December 01, 2023

超入門 SRE

ryuichi1208

December 01, 2023
Tweet

More Decks by ryuichi1208

Other Decks in Technology

Transcript

  1. 技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi •

    ロール: SRE • SNS: @ryuichi_1208 • 好きなこと: EOL対応、障害対応 • SRE NEXTスタッフ
  2. 4 • SRE(Site Reliability Engineering)とは、元々Googleが提唱したシステム管理と サービス運⽤に対するアプローチ ◦ SREは、ソフトウェアエンジニアに運⽤チームの設計を依頼した時にできあがる もの ◦

    直訳するとサイト信頼性⼯学 ▪ 信頼性⼯学とは「故障」という品質を扱う学問 ▪ 「事業の経済的損失」につながる可能性のある障害を全体的に最⼩にすることが⽬的 ◦ Site Reliability Engineerで職種を指したりする • Webサイトの信頼性を重要視したエンジニアリングを⾏ったり組織に対して導⼊ SREとは
  3. 11 • SREは信頼性をエンジニアリングしていく ◦ Webサイトを運営しながら短いサイクルで新機能のリリースを⾏うことを⽬標としていく ◦ 短いサイクルでのリリースでも信頼性を保ちつつ運⽤する ◦ SLO‧SLIを定義しサービスレベルの⽬標や指標を決めて運⽤していく ▪

    例えば⽬標としていた稼働率よりも低い時間しか稼働してないなら改善のために機能開発を⽌める ▪ ⽬標よりも⾼い時間稼働しているなら多少のサービスダウンは機能開発を継続する ▪ ビジネス影響を考慮して⽬標数値を決めることをSREがサービスオーナーと決定していく SREがいると
  4. 15