Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

EightのSREが向き合うプロダクトと組織

SansanTech
November 29, 2024

 EightのSREが向き合うプロダクトと組織

■ イベント
Findy Job LT
【SRE特集】プロダクト成長を支えるSRE 役割の変遷と今後の挑戦とは?

■ 発表者
技術本部 Eight Engineering Unit
間瀬 哲也

■ Eightエンジニア 採用情報
https://media.sansan-engineering.com/eight-engineer

■ Sansan Tech Blog
https://buildersbox.corp-sansan.com/

SansanTech

November 29, 2024
Tweet

More Decks by SansanTech

Other Decks in Technology

Transcript

  1. EightのSREが向き合うプロダクトと組織 Sansan株式会社 技術本部 Eight Engineering Unit 間瀬 哲也 Findy Job

    LT 【SRE特集】プロダクト成⻑を⽀えるSRE 役割の変遷と今後の挑戦とは?
  2. 2 © Sansan, Inc. 所属 - Sansan株式会社 技術本部 Eight Engineering

    Unit Platform グループ / Product Dev グループ 兼 技術本部 VPoE室 インフラ戦略グループ 略歴 - 2010年9⽉ Sansan株式会社⼊社 - オンプレ時代のSansan - 社内のIP電話設定 - インフラをAWSへリプレイス - Eightの⽴ち上げ など ⾃⼰紹介
  3. 8 © Sansan, Inc. 開発体制 Eight事業部 Eight Eingineering Unit Quality

    Assurance グループ Eight Event プロダクトマネジメント プロダクトマネジメント Web/API Web/API iOS Android ⽣産性改善 SRE QA QA ビジネスサイド ビジネスサイド
  4. 10 © Sansan, Inc. ざっくり歴史 第1期 インフラチームとして SLOを策定 第2期 主要機能の

    SLOを策定 第3期 SREチーム誕⽣ CUJ+SLOを策定 第4期 SREチームとして パフォーマンス改善
  5. 11 © Sansan, Inc. 第1期 インフラチームとしてSLOを策定 - モチベーション - システムの状態

    ≒ ⾃分たちの成果を定量化したい - ユーザ体験の毀損を明らかにしたい > メール配信 > Push通知配信 - 観点 - インフラの可⽤性 - サービス/システム全体としての指標
  6. 12 © Sansan, Inc. 第1期 インフラチームとしてSLOを策定 - 活動 - 定例で開発チームやEight事業部にも共有

    - ひたすらPDCAを回す > 原因調査 > サービス影響調査 > 開発メンバーへの共有 > 閾値の⾒直し - 課題 - インフラチームだけでやっている - 理解(のための説明)不⾜ - システム全体での影響度
  7. 13 © Sansan, Inc. - モチベーション - インフラチームだけでなくEight Engineering Unitとして意識をする

    > 開発者も⾃分事感が持てること - 観点 - API単位 > APMを活⽤ - DBパフォーマンス > Amazon Aurora の Performance Insights を活⽤ > SLOではなく、Observabilityの向上 第2期 主要機能のSLOを仮策定
  8. 14 © Sansan, Inc. - 活動 - 定例で開発チームとインフラで共有 - Performance

    Insightsを⾒るようにする > ドキュメンテーション > 問題発⽣時の参考スクリーンショットでの利⽤ - 課題 - システムとしての影響だけを⾒ている - 開発としての優先度に影響を及ぼせない 第2期 主要機能のSLOを仮策定
  9. 15 © Sansan, Inc. - モチベーション - CUJの策定 > SREチーム

    + プロダクト開発チーム + プロダクトマネージャ > ユーザの体験毀損を定量化 - 観点 - システムではなく、ユーザへの影響 - プロダクトとしての重要度 - ウィンドウベースSLOではなく、イベントベースSLO 第3期 SREチーム誕⽣
  10. 16 © Sansan, Inc. - 活動 - CUJの策定 - イベントベースなSLOの設定

    - ダッシュボード - アラート - 課題 - ⾮同期処理のパフォーマンスが計測できていない - モバイルアプリについての問題が計測できていない - 開発としての優先度に影響を及ぼせていない (再) 第3期 SREチーム誕⽣
  11. 17 © Sansan, Inc. - モチベーション - SREになる - インフラ業、データ基盤業に追われすぎている

    - SREとしてパフォーマンスを改善を実践 - 観点 - SLOの低下に限らない - ユーザ体験の毀損を減らす - (裏) アプリケーション実装に関わることへのハードルを取り除く 第4期 SREチームとしてパフォーマンス改善 Now!!
  12. 18 © Sansan, Inc. - 活動 - 他部⾨への改善アプローチ - 名刺のデータ化

    - 不要処理の除去 - ⾮効率処理の改善 - 課題 - 実装⼒やドメイン知識の不⾜ - 劇的な改善項⽬があまりない 第4期 SREチームとしてパフォーマンス改善 Now!!
  13. 21 © Sansan, Inc. - 信頼性向上 - 抽象的な⽬標 - チーム内の認識をそろえる

    ⇒ Maturity Modelの定義と実践 - ⽣産的な時間の確保 - トイル / 運⽤⼯数の削減 - Eightアプリケーションを知る - 多くのメンバーが元々インフラメイン - 逆Embed (短期留学) も検討中 - インフラ領域の委譲 - System Adminとしての権限を必要としない範囲 EightのSREは何を⽬指すのか
  14. 22 © Sansan, Inc. - 成熟度モデル - 組織の成⻑プロセスをダイン快適に評価・改善する枠組み - Eight

    SREのMaturity Model例 - パフォーマンス改善 - エラー率削減 - インシデント対応・ポストモーテム - セキュリティベースラインの確保 > これらを4段階で評価するためにモデルを定義中 Maturity Modelとは?
  15. 25 © Sansan, Inc. SREのプラクティスを 最⼤限実践する インフラエンジニアとしての 強みを持つ システム管理者としての 責任を果たす

    Eight事業・プロダクトの 成⻑に100%コミットする SRE Eight Engineer Infra Engineer System Administrator EightのSRE