Slide 1

Slide 1 text

SRE チーム立ち上げ前に 考えたこと・取り組んだこと 2024-07-05 Road to SRE NEXT@京都 BABY JOB 株式会社 浅野 正貴(@mackey0225)

Slide 2

Slide 2 text

今日の話は

Slide 3

Slide 3 text

「SRE」を どう根付かせていくか 現在進行系の話です

Slide 4

Slide 4 text

「SRE」を どう根付かせていくか 現在進行系の話です ポエム多めです

Slide 5

Slide 5 text

「SRE」を どう根付かせていくか 現在進行系の話です まだ真夜中

Slide 6

Slide 6 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 自己紹介 名前:浅野 正貴 所属:BABY JOB 株式会社 最近は AWS や SRE がメイン X: @mackey0225 SRE のイベントは初参加!

Slide 7

Slide 7 text

かんたんな経緯

Slide 8

Slide 8 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる

Slide 9

Slide 9 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート

Slide 10

Slide 10 text

考えたこと

Slide 11

Slide 11 text

体制をつくるにしても SRE に対するイメージも メンバーによって異なる気がす る

Slide 12

Slide 12 text

私たちにとっての「SRE」って なんだろう?

Slide 13

Slide 13 text

誰にとっての「信頼性」って なんだろう?

Slide 14

Slide 14 text

保護者 保育施設 開発者 CS

Slide 15

Slide 15 text

保護者 保育施設 開発者 CS 毎日使うようなものではなく、 アプリケーションとして お叱りや障害は少ない (ただし、自分の観測範囲)

Slide 16

Slide 16 text

保護者 保育施設 開発者 CS

Slide 17

Slide 17 text

保護者 保育施設 開発者 CS 利用しない日はない 開発しない日はない

Slide 18

Slide 18 text

外部から見た指標より 内部的な運用負荷を 軽減させるほうが良さそう

Slide 19

Slide 19 text

どのような負荷を 下げたいのか?

Slide 20

Slide 20 text

手動でのリリース お客様依頼の データメンテナンス エラー監視 EOL 対応 監査対応 脆弱性への対応 問い合わせに伴う ログ調査

Slide 21

Slide 21 text

手動でのリリース お客様依頼の データメンテナンス エラー監視 EOL 対応 監査対応 脆弱性への対応 問い合わせに伴う ログ調査 インフラに関する負荷が多い

Slide 22

Slide 22 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲

Slide 23

Slide 23 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲

Slide 24

Slide 24 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲 あれ、、 自分が抱え込んでいるやん

Slide 25

Slide 25 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲 とはいえ スケールアップはできん

Slide 26

Slide 26 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 経緯(組織&自分) ● 2023 年 ○ コンテナへの移行(EC2 → ECS / Fargate) ● 2024 年 1 月 ○ AWS インフラ領域のリソースの整理を担当 ● 2024 年 4 月 ○ サービスの規模拡大→SRE 的な動きが求められる 自分が1人目で、体制づくりからスタート 再掲 となると、 スケールアウトや!!

Slide 27

Slide 27 text

体制をつくる前に 組織のインフラの素養を 高めるのがファーストステップ

Slide 28

Slide 28 text

取り組んだこと

Slide 29

Slide 29 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 取り組み ● 直近 1 年の体制イメージ作成(未来予想図) ○ 一方で、進めながらピボットすることは考慮 ● 仲間集め・候補者探し ○ モブワーク ○ メンバー内で学びあうイベント ○ 輪読会 ○ 普段の会話から興味がある人を募る

Slide 30

Slide 30 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと 取り組み ● 直近 1 年の体制イメージ作成(未来予想図) ○ 一方で、進めながらピボットすることは考慮 ● 仲間集め・候補者探し ○ モブワーク(←まだ自分の作業を観てもらうまで) ○ メンバー内で学びあうイベント(←できていない😢) ○ 輪読会 ○ 普段の会話から興味がある人を募る

Slide 31

Slide 31 text

まとめ

Slide 32

Slide 32 text

SRE チーム立ち上げ前に考えたこと・取り組んだこと まとめ ● サービスに応じてフォーカスする部分を決める ○ ファーストステップをどこにおくか ● 人間はスケールアップできないのでスケールアウトする ○ ひとりで頑張っても限界はある ● 仮の目標を立てて、そのための土壌をつくる ○ 結果としてスキルトランスファーにもなる

Slide 33

Slide 33 text

ご清聴いただき ありがとうございました