SRE チーム立ち上げ前に考えたこと・取り組んだこと / Considerations and Preparations Before Establishing an SRE Team
by
mackey0225
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
SRE チーム立ち上げ前に 考えたこと・取り組んだこと 2024-07-05 Road to SRE NEXT@京都 BABY JOB 株式会社 浅野 正貴(@mackey0225)
Slide 2
Slide 2 text
今日の話は
Slide 3
Slide 3 text
「SRE」を どう根付かせていくか 現在進行系の話です
Slide 4
Slide 4 text
「SRE」を どう根付かせていくか 現在進行系の話です ポエム多めです
Slide 5
Slide 5 text
「SRE」を どう根付かせていくか 現在進行系の話です まだ真夜中
Slide 6
Slide 6 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 自己紹介 名前:浅野 正貴 所属:BABY JOB 株式会社 最近は AWS や SRE がメイン X: @mackey0225 SRE のイベントは初参加!
Slide 7
Slide 7 text
かんたんな経緯
Slide 8
Slide 8 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる
Slide 9
Slide 9 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート
Slide 10
Slide 10 text
考えたこと
Slide 11
Slide 11 text
体制をつくるにしても SRE に対するイメージも メンバーによって異なる気がす る
Slide 12
Slide 12 text
私たちにとっての「SRE」って なんだろう?
Slide 13
Slide 13 text
誰にとっての「信頼性」って なんだろう?
Slide 14
Slide 14 text
保護者 保育施設 開発者 CS
Slide 15
Slide 15 text
保護者 保育施設 開発者 CS 毎日使うようなものではなく、 アプリケーションとして お叱りや障害は少ない (ただし、自分の観測範囲)
Slide 16
Slide 16 text
保護者 保育施設 開発者 CS
Slide 17
Slide 17 text
保護者 保育施設 開発者 CS 利用しない日はない 開発しない日はない
Slide 18
Slide 18 text
外部から見た指標より 内部的な運用負荷を 軽減させるほうが良さそう
Slide 19
Slide 19 text
どのような負荷を 下げたいのか?
Slide 20
Slide 20 text
手動でのリリース お客様依頼の データメンテナンス エラー監視 EOL 対応 監査対応 脆弱性への対応 問い合わせに伴う ログ調査
Slide 21
Slide 21 text
手動でのリリース お客様依頼の データメンテナンス エラー監視 EOL 対応 監査対応 脆弱性への対応 問い合わせに伴う ログ調査 インフラに関する負荷が多い
Slide 22
Slide 22 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲
Slide 23
Slide 23 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲
Slide 24
Slide 24 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲 あれ、、 自分が抱え込んでいるやん
Slide 25
Slide 25 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲 とはいえ スケールアップはできん
Slide 26
Slide 26 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲 となると、 スケールアウトや!!
Slide 27
Slide 27 text
体制をつくる前に 組織のインフラの素養を 高めるのがファーストステップ
Slide 28
Slide 28 text
取り組んだこと
Slide 29
Slide 29 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 取り組み ● 直近 1 年の体制イメージ作成(未来予想図) ○ 一方で、進めながらピボットすることは考慮 ● 仲間集め・候補者探し ○ モブワーク ○ メンバー内で学びあうイベント ○ 輪読会 ○ 普段の会話から興味がある人を募る
Slide 30
Slide 30 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと 取り組み ● 直近 1 年の体制イメージ作成(未来予想図) ○ 一方で、進めながらピボットすることは考慮 ● 仲間集め・候補者探し ○ モブワーク(←まだ自分の作業を観てもらうまで) ○ メンバー内で学びあうイベント(←できていない😢) ○ 輪読会 ○ 普段の会話から興味がある人を募る
Slide 31
Slide 31 text
まとめ
Slide 32
Slide 32 text
SRE チーム立ち上げ前に考えたこと・取り組んだこと まとめ ● サービスに応じてフォーカスする部分を決める ○ ファーストステップをどこにおくか ● 人間はスケールアップできないのでスケールアウトする ○ ひとりで頑張っても限界はある ● 仮の目標を立てて、そのための土壌をつくる ○ 結果としてスキルトランスファーにもなる
Slide 33
Slide 33 text
ご清聴いただき ありがとうございました