Upgrade to Pro — share decks privately, control downloads, hide ads and more …

EightのSREが向き合うプロダクトと組織

Avatar for SansanTech SansanTech PRO
November 29, 2024

 EightのSREが向き合うプロダクトと組織

■ イベント
Findy Job LT
【SRE特集】プロダクト成長を支えるSRE 役割の変遷と今後の挑戦とは?

■ 発表者
技術本部 Eight Engineering Unit
間瀬 哲也

■ Eightエンジニア 採用情報
https://media.sansan-engineering.com/eight-engineer

■ Sansan Tech Blog
https://buildersbox.corp-sansan.com/

Avatar for SansanTech

SansanTech PRO

November 29, 2024
Tweet

More Decks by SansanTech

Other Decks in Technology

Transcript

  1. EightのSREが向き合うプロダクトと組織 Sansan株式会社 技術本部 Eight Engineering Unit 間瀬 哲也 Findy Job

    LT 【SRE特集】プロダクト成⻑を⽀えるSRE 役割の変遷と今後の挑戦とは?
  2. 2 © Sansan, Inc. 所属 - Sansan株式会社 技術本部 Eight Engineering

    Unit Platform グループ / Product Dev グループ 兼 技術本部 VPoE室 インフラ戦略グループ 略歴 - 2010年9⽉ Sansan株式会社⼊社 - オンプレ時代のSansan - 社内のIP電話設定 - インフラをAWSへリプレイス - Eightの⽴ち上げ など ⾃⼰紹介
  3. 8 © Sansan, Inc. 開発体制 Eight事業部 Eight Eingineering Unit Quality

    Assurance グループ Eight Event プロダクトマネジメント プロダクトマネジメント Web/API Web/API iOS Android ⽣産性改善 SRE QA QA ビジネスサイド ビジネスサイド
  4. 10 © Sansan, Inc. ざっくり歴史 第1期 インフラチームとして SLOを策定 第2期 主要機能の

    SLOを策定 第3期 SREチーム誕⽣ CUJ+SLOを策定 第4期 SREチームとして パフォーマンス改善
  5. 11 © Sansan, Inc. 第1期 インフラチームとしてSLOを策定 - モチベーション - システムの状態

    ≒ ⾃分たちの成果を定量化したい - ユーザ体験の毀損を明らかにしたい > メール配信 > Push通知配信 - 観点 - インフラの可⽤性 - サービス/システム全体としての指標
  6. 12 © Sansan, Inc. 第1期 インフラチームとしてSLOを策定 - 活動 - 定例で開発チームやEight事業部にも共有

    - ひたすらPDCAを回す > 原因調査 > サービス影響調査 > 開発メンバーへの共有 > 閾値の⾒直し - 課題 - インフラチームだけでやっている - 理解(のための説明)不⾜ - システム全体での影響度
  7. 13 © Sansan, Inc. - モチベーション - インフラチームだけでなくEight Engineering Unitとして意識をする

    > 開発者も⾃分事感が持てること - 観点 - API単位 > APMを活⽤ - DBパフォーマンス > Amazon Aurora の Performance Insights を活⽤ > SLOではなく、Observabilityの向上 第2期 主要機能のSLOを仮策定
  8. 14 © Sansan, Inc. - 活動 - 定例で開発チームとインフラで共有 - Performance

    Insightsを⾒るようにする > ドキュメンテーション > 問題発⽣時の参考スクリーンショットでの利⽤ - 課題 - システムとしての影響だけを⾒ている - 開発としての優先度に影響を及ぼせない 第2期 主要機能のSLOを仮策定
  9. 15 © Sansan, Inc. - モチベーション - CUJの策定 > SREチーム

    + プロダクト開発チーム + プロダクトマネージャ > ユーザの体験毀損を定量化 - 観点 - システムではなく、ユーザへの影響 - プロダクトとしての重要度 - ウィンドウベースSLOではなく、イベントベースSLO 第3期 SREチーム誕⽣
  10. 16 © Sansan, Inc. - 活動 - CUJの策定 - イベントベースなSLOの設定

    - ダッシュボード - アラート - 課題 - ⾮同期処理のパフォーマンスが計測できていない - モバイルアプリについての問題が計測できていない - 開発としての優先度に影響を及ぼせていない (再) 第3期 SREチーム誕⽣
  11. 17 © Sansan, Inc. - モチベーション - SREになる - インフラ業、データ基盤業に追われすぎている

    - SREとしてパフォーマンスを改善を実践 - 観点 - SLOの低下に限らない - ユーザ体験の毀損を減らす - (裏) アプリケーション実装に関わることへのハードルを取り除く 第4期 SREチームとしてパフォーマンス改善 Now!!
  12. 18 © Sansan, Inc. - 活動 - 他部⾨への改善アプローチ - 名刺のデータ化

    - 不要処理の除去 - ⾮効率処理の改善 - 課題 - 実装⼒やドメイン知識の不⾜ - 劇的な改善項⽬があまりない 第4期 SREチームとしてパフォーマンス改善 Now!!
  13. 21 © Sansan, Inc. - 信頼性向上 - 抽象的な⽬標 - チーム内の認識をそろえる

    ⇒ Maturity Modelの定義と実践 - ⽣産的な時間の確保 - トイル / 運⽤⼯数の削減 - Eightアプリケーションを知る - 多くのメンバーが元々インフラメイン - 逆Embed (短期留学) も検討中 - インフラ領域の委譲 - System Adminとしての権限を必要としない範囲 EightのSREは何を⽬指すのか
  14. 22 © Sansan, Inc. - 成熟度モデル - 組織の成⻑プロセスをダイン快適に評価・改善する枠組み - Eight

    SREのMaturity Model例 - パフォーマンス改善 - エラー率削減 - インシデント対応・ポストモーテム - セキュリティベースラインの確保 > これらを4段階で評価するためにモデルを定義中 Maturity Modelとは?
  15. 25 © Sansan, Inc. SREのプラクティスを 最⼤限実践する インフラエンジニアとしての 強みを持つ システム管理者としての 責任を果たす

    Eight事業・プロダクトの 成⻑に100%コミットする SRE Eight Engineer Infra Engineer System Administrator EightのSRE