Upgrade to Pro — share decks privately, control downloads, hide ads and more …

組織を創るカンリーSRE / Canly SRE to create an organization

Avatar for KeitoInoue KeitoInoue
October 22, 2023

組織を創るカンリーSRE / Canly SRE to create an organization

2023/10/20 ゆるSRE勉強会 #2
https://yuru-sre.connpass.com/event/293783/

Avatar for KeitoInoue

KeitoInoue

October 22, 2023
Tweet

Other Decks in Technology

Transcript

  1. 自己紹介 井上 慶人 出身・所在地 入社年月 所属/役職 所属チーム 好きなこと LT発表経験 イノウエ

    ケイト 兵庫県出身・東京都在住 2022年05月 エンジニア部 SREチーム スニーカー収集・アウトドア全般・飲み会 なし!初LTです! 初めてのLT発表です!お手柔らかにお願いします🙇 X(旧Twitter)はやってませんが、フィードバック頂けたら嬉しいです!
  2. SREチームを発足しました ☀ Good • PdM協力のもと、機能開発は加速している • 利用いただけるクライアントも増えてきた ☂ Bad •

    プロダクトや組織の土台が脆い • インシデント時の対応が遅い • 振り返りができていない 課題:利用者増加に伴い、機能開発以外が上手くいってない 機能開発以外の強化が必要💪 SRE-BOOK PartⅢ. Practices Figure III-1. Service Reliability Hierarchy https://sre.google/sre-book/part-III-practices/
  3. カンリーなりのSRE カンリーSREは土台を作り上げ、組織に展開し、浸透させていくエンジニア システムだけでなく、各種プロセスも考えなければいけない プロセス層 モニタ リング ポスト モーテム インシ デント

    管理 サービス レベル 管理 可用性 管理 etc... インフラストラクチャ層 AWSの各種サービス プロダクト開発層 プロダクト層 カンリー開発 カンリー ホームページ 開発 新プロダクト1開 発 新プロダクト2 開発 カンリー カンリー ホームページ 新プロダクト2 新プロダクト1 SRE 責任 範囲 各チーム 責任 範囲 • あくまで責任範囲の話 ◦ プロダクト開発をやらない、という訳ではない ◦ 最終的な責任を担う、という意味合い ≒ ITIL v4
  4. カンリーなりのSRE 事例1:インシデント管理 • 目的:システムを早急に回復させること • インシデントレベルの決定 • レベルに応じたフロー・アクション・報連相 • 効果:やることが明確化され、スピード感持って対応で

    きる 事例2:ポストモーテム • 目的:振り返りから学び・活かす • SREが率先して開催(記載)する • システムだけでなくプロセスも見直す • 効果:システム・プロセス両方を見直し、相乗的にプロダ クトの品質向上に寄与できる