Upgrade to Pro — share decks privately, control downloads, hide ads and more …

小さい組織での SRE の探求

Yuzo Iwasaki
February 10, 2023

小さい組織での SRE の探求

Yuzo Iwasaki

February 10, 2023
Tweet

More Decks by Yuzo Iwasaki

Other Decks in Technology

Transcript

  1. ©2023 CAMPFIRE, Inc. 2 自己紹介 岩崎 雄三 • CAMPFIRE VPoE

    兼プロダクト開発部部長 • 2016年に CAMPFIRE 入社後、負荷対策や デプロイ改善、SRE チームの立ち上げなどに 関わる。元リード SRE / SRE チームマネー ジャー • Twitter: @yuzoiwasaki
  2. 3 900万人 330万人 支援者数 申請から掲載までに 1ヶ月程度かかるプ ラットフォームが一般的ですが、 CAMPFIREでは審査は必要最低限に。 ページの作成も文字と画像を組み合わ せるだけで、誰でも簡単に作成可能で

    す。 私たちは「誰しもが声を上げられる世の 中」を作るために、ジャンル・規模は問い ません。オールジャンルで幅広い世代の 方にご利用頂いています。 ©2023 CAMPFIRE, Inc. これまでの累計支援者数は 900万人、 会員数は330万人を突破しました。 会員数
  3. ©2023 CAMPFIRE, Inc. 5 CAMPFIRE の開発組織 開発チーム 14名 SREチーム 3名

    コーポレートエンジニア リングチーム 2名 プロダクト開発部
  4. ©2023 CAMPFIRE, Inc. 6 CAMPFIRE の SRE の仕事 CAMPFIRE の

    SRE の仕事 • CAMPFIRE のミッションを実現するために、サービスの信頼 性を担保する • インフラの構築、運用がメイン • コードを書くことでインフラ課題を解決 • 最近 ECS を EC2 から Fargate に変更しました
  5. ©2023 CAMPFIRE, Inc. 8 小さい組織でどう SRE を実践していったか 小さい組織の良い点 • チームワークが良い

    • チーム間の垣根が低い • 対応がスピーディー • フィードバックサイクルが速い
  6. ©2023 CAMPFIRE, Inc. 9 小さい組織の悪い点 • 属人化しやすい • 兼任が多い •

    みんな忙しい • ローテーションが組みにくい 小さい組織でどう SRE を実践していったか
  7. ©2023 CAMPFIRE, Inc. 11 • チームワークが良い • チーム間の垣根が低い • 対応がスピーディー

    • フィードバックサイクルが速い 開発と運用の連携や SRE 文化の浸透が容 易 小さい組織でどう SRE を実践していったか
  8. ©2023 CAMPFIRE, Inc. 12 • チームワークが良い • チーム間の垣根が低い • 対応がスピーディー

    • フィードバックサイクルが速い バリューストリームにおけるフィードバックループ が速いため、DevOps と相性が良い 小さい組織でどう SRE を実践していったか
  9. ©2023 CAMPFIRE, Inc. 15 • 属人化しやすい • 兼任が多い • みんな忙しい

    • ローテーションが組みにくい 属人化を許容し、スムーズな運用に繋げる。 例えば、開発チームと SRE チームのマネー ジャーを特定の人間が兼任すれば衝突はなく なる 小さい組織でどう SRE を実践していったか
  10. ©2023 CAMPFIRE, Inc. 16 CAMPFIRE での事例 • 岩崎が開発チームと SRE チームのマネージャーを兼任し責

    任を負う ◦ どちらのチーム経験も長く全員と顔見知りなのでコミュニ ケーションがスムーズ ◦ コントロールではなくコンテキストを重視 • 徐々に組織が大きくなり余裕ができたら、それぞれのチーム にマネージャーを立てて権限を委譲
  11. ©2023 CAMPFIRE, Inc. 17 • 属人化しやすい • 兼任が多い • みんな忙しい

    • ローテーションが組みにくい 強制せず、まずは一人でもやってみるところか ら始める。MTGの頻度を減らす。少しずつ変 えていく 小さい組織でどう SRE を実践していったか
  12. ©2023 CAMPFIRE, Inc. 18 CAMPFIRE での事例 • 任意参加 & 事前準備不要の

    SRE 本の輪読会を開催 ◦ 本がない人は各章のテーマについてネットで調べて勉強 すればOK ◦ 開発チームなど他のチームの参加もOK • チームの忙しさに合わせて、本来は毎週行うべきプロダク ションミーティングの頻度を隔週に • 少しずつ変えるのは SRE のベストプラクティスでもある。まず はやってみることから始めた
  13. ©2023 CAMPFIRE, Inc. 19 • 属人化しやすい • 兼任が多い • みんな忙しい

    • ローテーションが組みにくい 無理せずベストエフォート対応に。ただし、事 前にリスクは最小化する 小さい組織でどう SRE を実践していったか
  14. ©2023 CAMPFIRE, Inc. 20 CAMPFIRE での事例 • 開発者に広く権限を与え、SRE 以外も緊急時に対応できる 体制に。特に当番は決めず、気づいた人が対応する

    • 定時前や休日前はデプロイしないなど運用ルールを整備し てリスクを最小化。デプロイの粒度も日常的に小さくしておく • ビジネスサイドとも常にコミュニケーションを取っておき、大型 案件が公開されるなどの情報は事前に共有してもらう
  15. ©2023 CAMPFIRE, Inc. 24 CAMPFIRE での事例 CAMPFIRE のミッション・バリュー https://campfire.co.jp/mission/ 04.

    人に優しくあろう 人に優しくあろう。痛みを知っているからこそ、失敗を過去にしたからこそ、他者に優しくで きる。 07. 言葉を大事にしよう 言葉を大事にしよう。言葉は態度となり、態度は必ず相手へと伝わる。常に謙虚な気持ち を忘れず、軽薄な言葉や、誰かを貶める発言に気をつけよう。
  16. ©2023 CAMPFIRE, Inc. 25 CAMPFIRE での事例 • 非難のないポストモーテムを導入し、失敗から学んでいくカ ルチャーを醸成 •

    カンバンを使い、WIP 制限を設けつつ、ボトムアップで改善 を進めていくプル型の運用を実現 • 特定の人間に運用負荷が集中しないように、手動対応は極 力自動化し、50%は成長できる仕事に当てられるように
  17. ©2023 CAMPFIRE, Inc. 28 まとめ • 小さい組織でも、小さい組織だからこそ SRE を実践すること は可能

    • SRE 本をそのまま実践するのではなく、チームにあった工夫 をすることがだいじ • その際は DevOps や SRE のプラクティスを導入して健全な カルチャーを作ると良い