マルチプロダクト環境におけるSREの役割 / SRE NEXT 2025 lunch session
by
sugamasao
×
Copy
Open
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Slide 1
Slide 1 text
© SmartHR, Inc. マルチプロダクト環境における SREの役割 〜SmartHRの組織⽴ち上げから学ぶ実践知〜 すがわら まさのり(@sugamasao) SmartHR テクノロジーマネジメント本部 2025/7/12 SRE NEXT 2025 画像を置換
Slide 2
Slide 2 text
提供🍱 SmartHR
Slide 3
Slide 3 text
提供🍱 SmartHR お弁当がおいしかったらXで 投稿お願いします!😋
Slide 4
Slide 4 text
とにかくどうしても 伝えたいこと 4
Slide 5
Slide 5 text
SmartHRでは SREを積極採⽤中 です!!!!!!1 5
Slide 6
Slide 6 text
はい 6
Slide 7
Slide 7 text
すがわら まさのり(sugamasao) スピーカー紹介 2020/5〜 バックエンドエンジニアとして⼊社 基本機能というデカRailsアプリの開発 2022/10〜 上記プロダクト内のエンジニア組織マネージャー 2024/1〜 テクノロジーマネジメント本部の⽴ち上げ SRE/PSIRT/DPEの管掌を⾏うマネージャー
Slide 8
Slide 8 text
すがわら まさのり(sugamasao) スピーカー紹介 2020/5〜 バックエンドエンジニアとして⼊社 基本機能というデカRailsアプリの開発 2022/10〜 上記プロダクト内のエンジニア組織マネージャー 2024/1〜 テクノロジーマネジメント本部の⽴ち上げ SRE/PSIRT/DPEの管掌を⾏うマネージャー SmartHR⼊社まではずっと バックエンドエンジニア だったよ
Slide 9
Slide 9 text
すがわら まさのり(sugamasao) スピーカー紹介(趣味)
Slide 10
Slide 10 text
すがわら まさのり(sugamasao) スピーカー紹介(趣味) Rubyチョットわかる
Slide 11
Slide 11 text
私とSRE NEXT
Slide 12
Slide 12 text
私とSRE NEXT 1年ぶり2回⽬のSRE NEXTです よろしくおねがいします
Slide 13
Slide 13 text
マルチプロダクト環境における SREの役割
Slide 14
Slide 14 text
今⽇のテーマ 1. SRE⽴ち上げの背景 2. SRE⽴ち上げで気をつけたポイント 3. SREのいま
Slide 15
Slide 15 text
SRE⽴ち上げの背景
Slide 16
Slide 16 text
……の前にプロダクトについて かんたんに紹介させてください ※組織やプロダクトの構成とSREの関わり⽅は 強い影響があるので前提を揃えさせて🙏 16
Slide 17
Slide 17 text
17
Slide 18
Slide 18 text
18
Slide 19
Slide 19 text
SmartHRのプロダクトの特徴 💡「従業員データベース」を中⼼とした マルチプロダクト構成 ● 従業員のデータを持っている「デカWebアプリ」 ● 従業員のデータを活⽤する「たくさんのWebアプリ」 19
Slide 20
Slide 20 text
SmartHRのプロダクトの特徴 💡「従業員データベース」を中⼼とした マルチプロダクト構成 ● 従業員のデータを持っている「デカWebアプリ」 ● 従業員のデータを活⽤する「たくさんのWebアプリ」 これからもWebアプリは増えていくぞ 20 ポイント
Slide 21
Slide 21 text
SmartHRのプロダクトの特徴 💡プロダクトを開発するチームは 「ストリームアラインドチーム」 ● フロントエンド/バックエンド/インフラなど、ほぼ全て の開発‧運⽤は⾃⾝のチームで完結するスタイル ● プロダクトの新規⽴ち上げ、インフラ環境の構築も担当 チームが⾏う 21
Slide 22
Slide 22 text
SmartHRのプロダクトの特徴 💡そうは⾔っても各チームが⾃助努⼒で がんばる、は無理がある部分も出てきた ● より適したインフラ構成の模索 ● 各プロダクトが共通で利⽤するTerraformモジュールな ど「誰の持ち物でもない」けれど利⽤しているインフラ 関連の課題に対してオーナーシップが持ちにくい状態 ● 信頼性に関する品質向上の取り組み 22
Slide 23
Slide 23 text
SmartHRのプロダクトの特徴 💡「SRE」組織を⽴ち上げましょう ● 時はきた ○ 2023年後半に体制の検討 ○ 2024年1⽉から「SRE」組織の組成 23
Slide 24
Slide 24 text
今⽇のテーマ 1. SRE⽴ち上げの背景 2. SRE⽴ち上げで気をつけたポイント 3. SREのいま
Slide 25
Slide 25 text
SRE⽴ち上げで気をつけたポイント
Slide 26
Slide 26 text
SRE組織の⽴ち上げ 💡「SRE」組織を⽴ち上げるぞ ● 「プロダクトを開発しているチームの⾃律性と能⼒向上」 を重視したい ● いわゆるイネイブリングチームとしてのSRE インフラ構築の代⾏ ミドルウェアやフレームワークのアップデート 26
Slide 27
Slide 27 text
SRE組織の⽴ち上げ 27 💡 SRE組織の⽴ち上げ ● 私がSRE組織のマネージャーとして就任 ● プロダクト開発チームからSREを希望しているメンバー を1名アサイン
Slide 28
Slide 28 text
SRE組織の⽴ち上げ 28 💡 致命的な課題
Slide 29
Slide 29 text
SRE組織の⽴ち上げ 29 💡 致命的な課題 SRE経験者がいない
Slide 30
Slide 30 text
💡どうしよ ● 課題に着⼿できるイメージはあるものの…… ○ ベースとなる考え⽅がふわふわしてる ● 課題感はあるが、⽬の前の「気がついた」ことベースで 課題に取り組むだけだと中⻑期的な課題と向き合うの が難しいのでは? SRE組織の⽴ち上げ 30
Slide 31
Slide 31 text
💡ぜったい避けたいこと ● ⽬の前の課題解決に集中してしまい、各プロダクトの成 ⻑に寄与できないこと ● インフラや信頼性が課題となって事業成⻑の⾜枷となっ てしまうこと ● 他のチームから「インフラやってくれる⼈」と思われる こと ○ SREの定義は会社によって千差万別なので SRE組織の⽴ち上げ 31
Slide 32
Slide 32 text
💡たったひとつの冴えたやりかた ● 有識者に頼ろう!(それはそう) SRE組織の⽴ち上げ 32
Slide 33
Slide 33 text
💡たったひとつの冴えたやりかた ● 有識者に頼ろう!(それはそう) SRE組織の⽴ち上げ 33 中⻑期のロードマップやSREとしての⽅針‧期待値など 整えていかないといけないが、体系⽴てて考えるための知⾒ が不⾜していた ポイント
Slide 34
Slide 34 text
💡有識者 is ● 株式会社Topotal の@rrreeeyyy さんが相談に乗ってい ただけることに 本当にお世話になっております🙏 SRE組織の⽴ち上げ 34
Slide 35
Slide 35 text
💡⾒えてきた基本⽅針 ● rrreeeyyy さんにSREの⽅針を相談している中で教えて もらったリソース ○ What’s your org’s reliability mindset? Insights from Google SREs SRE組織の⽴ち上げ 35
Slide 36
Slide 36 text
💡What’s your org’s reliability mindset? Insights from Google SREs ● Googleで信頼性に関する活動から⾒出された 信頼性を表す5つの分類 ○ absent, reactive, proactive, strategic, visionary SRE組織の⽴ち上げ 36
Slide 37
Slide 37 text
💡我々のプロダクトの段階は? ● 多くのプロダクトはreactiveな段階だということがわ かった ○ 信頼性に関するメトリクスやアラートの設定はある ○ ポストモーテムの作成や再発防⽌策も取れている ○ しかし、潜在的な課題解決など⻑期的な投資を計画 的には⾏えていない SRE組織の⽴ち上げ 37
Slide 38
Slide 38 text
💡信頼性に関するレベルを上げたい ● 潜在的なリスクの把握や課題解決の優先付けができる状 態にすることで、障害など信頼性を損ねる前に解決でき る状態が良い ● つまり、問題が起きる前に解決できるような、 proactiveな状態を⽬指したい SRE組織の⽴ち上げ 38
Slide 39
Slide 39 text
💡課題に気がつけるようにするためには ● 各プロダクトのアラート設定の整備 ● SLOの導⼊ ○ 信頼性の可視化 ○ 課題解決へ向けた投資のバランス SRE組織の⽴ち上げ 39
Slide 40
Slide 40 text
💡課題に気がつけるようにするためには ● 各プロダクトのアラート設定の整備 ● SLOの導⼊ ○ 信頼性の可視化 ○ 課題解決へ向けた投資のバランス SRE組織の⽴ち上げ 40 SRE⽴ち上げ当時からSLOの導⼊は検討していたが、 rrreeeyyy さんのアドバイスやGoogleのドキュメントを読むことでSLOの導 ⼊‧推進する際のベースとなる考え⽅を⼿に⼊れることができた
Slide 41
Slide 41 text
💡詳しくはテックブログにも書きました! SRE組織の⽴ち上げ 41
Slide 42
Slide 42 text
💡ぜったい避けたいこと(再掲) ● ⽬の前の課題解決に集中してしまい、各プロダクトの成 ⻑に寄与できないこと ● インフラや信頼性が課題となって事業成⻑の⾜枷となっ てしまうこと ● 他のチームから「インフラやってくれる⼈」と思われる こと ○ SREの定義は会社によって千差万別なので SRE組織の⽴ち上げ 42
Slide 43
Slide 43 text
💡SRE組織⽴ち上げで取り組んだポイント ● インセプションデッキを作成してSREチーム内での役割 や期待値の整理 ● ロードマップの作成 SRE組織の⽴ち上げ 43
Slide 44
Slide 44 text
💡SRE組織⽴ち上げで取り組んだポイント ● インセプションデッキを作成してSREチーム内での役割 や期待値の整理 ● ロードマップの作成 SRE組織の⽴ち上げ 44
Slide 45
Slide 45 text
💡インセプションデッキ インセプションデッキを作ろう “インセプションデッキは、プロダクトづくりに関わるメンバーが各々の意⾒を持ち 寄って共通認識をつくり出すための⼤事な質問、もしくは対話の場を指す。インセプ ションデッキの内容は10個の⼿ごわい質問(タフクエッション)で構成される。 チーム⽴ち上げ時期やプロダクトの⽅向性を⾒直すタイミングで質問の解となるデッキ (スライド)をメンバーと対話しながら作成や更新を⾏う。インセプションデッキは書 籍『アジャイルサムライ』の中でJonathan Rasmussonによって紹介された。” インセプションデッキ | Agile Studio 45 アジャイルサムライ ――達人開発者 への道 | コンピュータ・一般書 ,プロ グラミング・開発 ,開発技法 | Ohmsha
Slide 46
Slide 46 text
インセプションデッキを作ろう 💡10個の⼿ごわい質問(1) ● 我々はなぜここにいるのか? ● エレベーターピッチ ● パッケージデザイン ● やらないことリスト ● 「ご近所さん」を探せ(プロジェクトコミュニティ) 46
Slide 47
Slide 47 text
インセプションデッキを作ろう 💡10個の⼿ごわい質問(2) ● 解決案を描く(ざっくりアーキテクチャ図) ● 夜も眠れなくなるような問題は何だろうか?(リスク) ● 期間を⾒極める ● 何を諦めるのかはっきりさせる(トレードオフスライダー) ● 何がどれだけ必要なのか 47
Slide 48
Slide 48 text
💡インセプションデッキの狙い ● チーム内で共通認識を作成するため ● チームビルディングのため インセプションデッキを作ろう 48
Slide 49
Slide 49 text
💡インセプションデッキを作ろう ● いくつかの質問はスキップしつつも我々がどう考えてい るのかを⾔語化する インセプションデッキを作ろう 49 当時作成したインセプション デッキから抜粋
Slide 50
Slide 50 text
💡SRE組織⽴ち上げで取り組んだポイント ● インセプションデッキを作成してSREチーム内での役割 や期待値の整理 ● ロードマップの作成 SRE組織の⽴ち上げ 50
Slide 51
Slide 51 text
💡ロードマップの狙い ● 半期の計画を⽴てる ● 本当に解決すべき課題は何か?をブラさないため ● 注⼒するポイントや成果の現在地を把握しやすくするた め ロードマップを作ろう 51
Slide 52
Slide 52 text
💡ロードマップを作ろう ● 「やりたいこと」はたくさん出るので、それを体系⽴て てアラインしたい ● 「Google Cloud Well-Architected Framework」を ベースに「やりたいこと」「やること」を整理 ロードマップを作ろう 52 https://cloud.google.com/architecture/framework?hl=ja
Slide 53
Slide 53 text
💡Google Cloud Well-Architected Framework ロードマップを作ろう 53 https://cloud.google.com/architecture/framework?hl=ja
Slide 54
Slide 54 text
💡ロードマップ ● 5つの柱をベースにしつつ、重要度や緊急度を鑑みて 「やること」を整理 ロードマップを作ろう 54
Slide 55
Slide 55 text
💡SREチームの期待値や⽅針を決められた ● SREチームとしても認識が揃ったので注⼒するポイント を⾒失わなかった ● 関係するプロダクト開発チームにとっても、SREチーム に対する期待値を揃えられたのでスムーズなやりとりが できた やったぜ😉 SREの⽅針決め 55
Slide 56
Slide 56 text
今⽇のテーマ 1. SRE⽴ち上げの背景 2. SRE⽴ち上げで気をつけたポイント 3. SREのいま
Slide 57
Slide 57 text
SREのいま
Slide 58
Slide 58 text
SREのいま ‼SREのメンバー数 58
Slide 59
Slide 59 text
SREのいま 💡少⼈数でどのように改善していくか ● 全てのプロダクトの設定をSRE主導で変えてい くのはたいへん ● 変更理由や背景を伝え、各プロダクトチーム が変更しやすい状況を作りつつ設定変更をお 願いしていく ○ 知⾒や設計思想の共有にもなる 59
Slide 60
Slide 60 text
SREのいま 💡「レバレッジ」を意識した活動 ● SLOを幅広く導⼊できる⼯夫 ● オーナーシップ不在だったTerraformモ ジュール群やアラート設定の整理 ● 過剰だったCloud SQLバックアップ数の適 正化をはじめとするコスト削減 60
Slide 61
Slide 61 text
SREのいま 💡そうは⾔っても2名でやれんのか ● やりたいけど⼿が⾜りない部分もたくさん ある ● そんな状況でも取捨選択しながら組織とし て重要度の⾼いことに絞って成果を積み上 げています 61
Slide 62
Slide 62 text
SREのいま 💡「やる」ために ● 信頼性を測るための⼤きな⼀歩となるSLO の導⼊は⼯夫していかないと難しい ● それを進めるにはどうしたら良いか 62
Slide 63
Slide 63 text
どうやってマルチプロダクトにSLOを導⼊したか? 💡詳しくはこちらのセッションをご覧ください! 63 https://sre-next.dev/2025/schedule/#slot060
Slide 64
Slide 64 text
どうやってマルチプロダクトにSLOを導⼊したか? 💡詳しくはこちらのセッションをご覧ください! 64 https://sre-next.dev/2025/schedule/#slot060 これから!
Slide 65
Slide 65 text
SRE組織の今後 💡2名で充⾜している? ● ぜんぜん⾜りてない!!!1 ● SLOの導⼊など、「いまやっていること」を広 げていく点でも不⾜している ● より各プロダクトに寄り添った⽀援をしてい きたいけれど、「浅く広く」にならざるを得 ない 65
Slide 66
Slide 66 text
SRE組織の今後 💡いまはイネイブリングが中⼼だけど ● マルチプロダクトという戦略上、「新規プロダク トの⽴ち上げ」もレバレッジが効くポイント ● 初期のインフラ構築、CI/CD環境の設定をよりス ムーズにするためプラットフォームエンジニアリ ングっぽいものも⼒を⼊れていきたい ● やりたいこと⼤盛 66
Slide 67
Slide 67 text
SmartHRでは SREを積極採⽤中 です!!!!!!1 67
Slide 68
Slide 68 text
68 https://open.talentio.com/r/1/c/s marthr/pages/98449
Slide 69
Slide 69 text
提供🍱 SmartHR
Slide 70
Slide 70 text
SRE NEXTに参加しているSmartHRの社員は↓ のパーカーを着ているので、SREについて、イ ンフラについてなど気になることがあればぜひ お声がけください😃 70
Slide 71
Slide 71 text
SmartHRでは SREを積極採⽤中 です!!!!!!1 71