Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SREチームの存在しない組織における SREing
Search
temama
July 24, 2025
0
190
SREチームの存在しない組織における SREing
2025/07/23 深堀り!現場のSRE 〜いろんなアーキテクチャ編〜 の登壇資料です。
https://mixi.connpass.com/event/360755
temama
July 24, 2025
Tweet
Share
Featured
See All Featured
Gamification - CAS2011
davidbonilla
81
5.5k
Optimising Largest Contentful Paint
csswizardry
37
3.5k
Why Our Code Smells
bkeepers
PRO
340
57k
Six Lessons from altMBA
skipperchong
29
4.1k
We Have a Design System, Now What?
morganepeng
54
7.9k
Raft: Consensus for Rubyists
vanstee
140
7.2k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Statistics for Hackers
jakevdp
799
220k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
Fireside Chat
paigeccino
41
3.7k
RailsConf 2023
tenderlove
30
1.3k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Transcript
1 © Repro Inc. Repro株式会社 Development Division Platform Team Sys-infra
Unit 今 利仁 “SRE チーム” のない組織における SREing
2 © Repro Inc. 2 © Repro Inc. 本⽇のお話 •
Repro について • Repro アーキテクチャの紹介 ◦ インフラ構成 ◦ Repro 組織構成 • Repro 組織における SRE ◦ SRE チームの存在しない組織における SREing ◦ 事例紹介 話さないこと • SRE とは何か、SLI/SLO などの⽤語の解説
3 © Repro Inc. 3 ⾃⼰紹介 今 利仁 2024/10 ⼊社
Sys-infra として Repro 基盤のミドルウェアの保守 運⽤、開発チームの⽀援を担当。 好きな本: - ピープルウェア - 恐れのない組織 Kon Toshihito Repro株式会社 Development Division, Platform Team, Sys-infra Unit 3 © Repro Inc.
4 © Repro Inc. Repro について
5 © Repro Inc. ⾏動情報 Repro(Marketing Automation ツール)で実現できること Repro のご紹介
収集 整理 活⽤ アプリ Web 設定情報 属性情報 登録⽇ お気に⼊り 性別 都道府県 誕⽣⽇ OS 購⼊⾦額 会員ランク 初回購⼊⽇ 最終購⼊⽇ タイミング ページ閲覧 取得 集約 店舗 CDP/DWH 位置情報 アンケート ゼロパーティ データ 吹き出し UI/UX改善 プッシュ通知 メール/LINE レコメンド サーベイ ポップアップ 年齢 MMP アプリ バージョン シナリオ‧ ステップ配信 ‧収集:Input/Collection ‧整理: Segmentation ‧活⽤:Output/Delivery 様々なデータをSDKの⾃動取込みや、簡単な連携⽅式にて集約が可能 属性/⾏動/設定情報などからリアルタイムでのセグメント設定が可能 多様なチャネル/⽅式により、One to Oneコミュニケーションを実現
6 © Repro Inc. 6 © Repro Inc. Repro について
Repro SDK を 導⼊したアプリケーション ユーザーイベント (操作ログ) Repro • イベントを元に セグメンテーション • キャンペーンの 効果測定 対象ユーザーへ Push 通知など ※ イベント:EC であれば「商品ページ閲覧」「カートに追加」「購⼊完了」 など
7 © Repro Inc. 7 © Repro Inc. Repro について
• ⼤量のイベントを受け取り、集計のために保存する • イベントの内容で対象ユーザーを更新する • 条件に合致するユーザーを集計する(セグメンテーション) • 対象ユーザーへ Push 通知を送信する → ハイトラフィック、Write Heavy、リアルタイム、バッチ処理
8 © Repro Inc. Repro アーキテクチャの紹介
9 © Repro Inc. 9 © Repro Inc. Repro のアーキテクチャ
~インフラ構成~ ⾏動ログ Repro SDK キャンペーン作成 外部データ取り込み 管理画⾯ ユーザーセグメンテーション キャンペーン効果測定 内部処理 時限配信 イベントフック Push 通知 メール送信 メッセージ送信 LINE 送信 通知⼀覧 メッセージ送信
10 © Repro Inc. 10 © Repro Inc. Repro のアーキテクチャ
~インフラ構成~ ⾏動ログ API キャンペーン作成 外部データ取り込み ユーザーセグメンテーション キャンペーン効果測定 時限配信 イベントフック 通知⼀覧 API Push 通知 メール送信 LINE 送信 イベント収集 セグメンテーション ユーザーへ配信 DB 配信基盤
11 © Repro Inc. 11 © Repro Inc. Repro のアーキテクチャ
~インフラ構成~ ⾏動ログ API キャンペーン作成 外部データ取り込み ユーザーセグメンテーション キャンペーン効果測定 時限配信 イベントフック 通知⼀覧 API Push 通知 メール送信 LINE 送信 イベント収集 セグメンテーション ユーザーへ配信 DB 配信基盤 やることが… やることが多い …!! (画像略)
12 © Repro Inc. 12 © Repro Inc. Repro のアーキテクチャ
~インフラ構成~ Kafka topic ⾏動ログ受信 API ユーザー特定処理 Kafka topic 諸々 Kafka topic 保存系 Kafka topic 配信 Kafka topic 保存系 Kafka topic 諸々 諸々 Kafka topic 諸々 諸々 Kafka topic 諸々 諸々 Kafka topic 諸々
13 © Repro Inc. 13 © Repro Inc. Repro のアーキテクチャ
~組織構成~ Repro Team Platform Team Development Division Feature Team 1 Sys-infra Repro core Feature Team 2 Feature Team 3 Repro SDK
14 © Repro Inc. 14 © Repro Inc. Repro のアーキテクチャ
~組織構成~ Sys-Infra 水・ガスの安定した供給 Repro Core 便利な道具の開発 Feature Team 料理を作る
15 © Repro Inc. 15 © Repro Inc. Repro のアーキテクチャ
~組織構成~ Kafka topic ⾏動ログ受信 API ユーザー特定処理 Kafka topic 諸々 Kafka topic 保存系 Kafka topic 配信 Kafka topic 保存系 Kafka topic 諸々 諸々 Kafka topic 諸々 諸々 Kafka topic 諸々 諸々 Kafka topic 諸々 Repro Core Feature Team Kafka ECS Cassandra Sys-infra 諸々
16 © Repro Inc. Repro 組織における SRE
17 © Repro Inc. 17 © Repro Inc. Repro 組織における
SRE Repro に SRE 専任チームは存在しない • SRE として採⽤を募集しているが、配属としては Platform Team • 実際の業務もインフラの割合が多く、SRE の取り組みに割けるリソースは 限られている Repro Team Platform Team Development Division Feature Team Sys-infra Repro core Repro SDK
18 © Repro Inc. 18 © Repro Inc. Repro 組織における
SRE コンポーネントのアラートは作成したチームが対応する • 顧客に提供する多くの機能は Feature Team が受け持っている • 必然的に多くの SLI/SLO を運⽤するのは Feature Team になる では SRE の取り組みはどのように浸透させていったのか?という紹介が 今⽇のお話
19 © Repro Inc. 19 © Repro Inc. Repro 組織における
SRE 1. 取り組むことを決めてチームを超えて合意を取る 2. 担当者を決める 3. 担当者が主導して取り組む 4. 定期的に振り返りや改善の機会を作る
20 © Repro Inc. Repro 組織における SRE 1. 取り組むことを決めてチームを超えて合意を取る 20
© Repro Inc. Repro では、4半期毎に各チームで取り組むことを決めて共有する (ロードマップの作成) このタイミングで他チームに関わる取り組みについて、他チームに共有、合意を 取っているのが Repro の強み(と思っています) ⚠この⼯程をスキップすると「SRE チームから仕事が追加で降ってきた…」 と思われかねない
21 © Repro Inc. Repro 組織における SRE 2. 担当者を決める 21
© Repro Inc. 担当者は SRE のスペシャリストである必要はなく、導⼊する取り組みについての 知識があれば OK • SLI/SLO、エラーバジェット運⽤の推進タスク担当者 • ポストモーテム運⽤の推進タスク担当者 • モニタリング‧アラートの整理‧健全化の推進タスク担当者 もちろん調査から始めても OK どのような形であれば組織にとって有⽤なものになるか
22 © Repro Inc. Repro 組織における SRE 3. 担当者が主導して取り組む 22
© Repro Inc. • 取り組みについて、関わる⼈全員の認識を合わせる ◦ 資料作成 ◦ 勉強会 • 具体的に取り組む内容について説明し、取り組んでもらう ◦ なにをもってゴールとするか
23 © Repro Inc. Repro 組織における SRE 4. 定期的に振り返りや改善の機会を作る 23
© Repro Inc. Repro ではタスクを ClickUp で管理しており、四半期に1回や半年に1回など 周期的な予定を設定しています • 取り組みは業務の役にたっているか? • 負担が増えすぎていないか? • 期待している効果は現状の取り組み⽅で得られているか?
24 © Repro Inc. 24 © Repro Inc. Repro 組織における
SRE ~事例紹介~ SLI/SLO、エラーバジェットの運⽤を始める • 合意を取る • 各チームと SLI/SLO、エラーバジェットについて認識合わせ ◦ 「SLO についての前提知識」 ◦ 「Repro における SLO 運⽤フロー」 ◦ 社内勉強会 • 取り組んでもらう ◦ 既存機能の SLO を策定 • 試験運⽤ ◦ モニターを作成して、無理のない SLO を設定していないか、など • 本番運⽤ ◦ Weekly で SLI/SLO、エラーバジェット消費量チェック ◦ エラーバジェットが半分を切っていたら担当チームで対策を⽴てる ◦ 新機能の設計時点で SLI/SLO を決めてレビューする
25 © Repro Inc. ありがとうございました! Repro では⾼負荷環境を扱うエンジニアを募集しています!