Slide 1

Slide 1 text

© SmartHR, Inc. マルチプロダクト環境における SREの役割 〜SmartHRの組織⽴ち上げから学ぶ実践知〜 すがわら まさのり(@sugamasao) SmartHR テクノロジーマネジメント本部 2025/7/12 SRE NEXT 2025 画像を置換

Slide 2

Slide 2 text

提供🍱 SmartHR

Slide 3

Slide 3 text

提供🍱 SmartHR お弁当がおいしかったらXで 投稿お願いします!😋

Slide 4

Slide 4 text

とにかくどうしても 伝えたいこと 4

Slide 5

Slide 5 text

SmartHRでは SREを積極採⽤中 です!!!!!!1 5

Slide 6

Slide 6 text

はい 6

Slide 7

Slide 7 text

すがわら まさのり(sugamasao) スピーカー紹介 2020/5〜 バックエンドエンジニアとして⼊社 基本機能というデカRailsアプリの開発 2022/10〜 上記プロダクト内のエンジニア組織マネージャー 2024/1〜 テクノロジーマネジメント本部の⽴ち上げ SRE/PSIRT/DPEの管掌を⾏うマネージャー

Slide 8

Slide 8 text

すがわら まさのり(sugamasao) スピーカー紹介 2020/5〜 バックエンドエンジニアとして⼊社 基本機能というデカRailsアプリの開発 2022/10〜 上記プロダクト内のエンジニア組織マネージャー 2024/1〜 テクノロジーマネジメント本部の⽴ち上げ SRE/PSIRT/DPEの管掌を⾏うマネージャー SmartHR⼊社まではずっと バックエンドエンジニア だったよ

Slide 9

Slide 9 text

すがわら まさのり(sugamasao) スピーカー紹介(趣味)

Slide 10

Slide 10 text

すがわら まさのり(sugamasao) スピーカー紹介(趣味) Rubyチョットわかる

Slide 11

Slide 11 text

私とSRE NEXT

Slide 12

Slide 12 text

私とSRE NEXT 1年ぶり2回⽬のSRE NEXTです よろしくおねがいします

Slide 13

Slide 13 text

マルチプロダクト環境における SREの役割

Slide 14

Slide 14 text

今⽇のテーマ 1. SRE⽴ち上げの背景 2. SRE⽴ち上げで気をつけたポイント 3. SREのいま

Slide 15

Slide 15 text

SRE⽴ち上げの背景

Slide 16

Slide 16 text

……の前にプロダクトについて かんたんに紹介させてください ※組織やプロダクトの構成とSREの関わり⽅は  強い影響があるので前提を揃えさせて🙏 16

Slide 17

Slide 17 text

17

Slide 18

Slide 18 text

18

Slide 19

Slide 19 text

SmartHRのプロダクトの特徴 💡「従業員データベース」を中⼼とした マルチプロダクト構成 ● 従業員のデータを持っている「デカWebアプリ」 ● 従業員のデータを活⽤する「たくさんのWebアプリ」 19

Slide 20

Slide 20 text

SmartHRのプロダクトの特徴 💡「従業員データベース」を中⼼とした マルチプロダクト構成 ● 従業員のデータを持っている「デカWebアプリ」 ● 従業員のデータを活⽤する「たくさんのWebアプリ」 これからもWebアプリは増えていくぞ 20 ポイント

Slide 21

Slide 21 text

SmartHRのプロダクトの特徴 💡プロダクトを開発するチームは 「ストリームアラインドチーム」 ● フロントエンド/バックエンド/インフラなど、ほぼ全て の開発‧運⽤は⾃⾝のチームで完結するスタイル ● プロダクトの新規⽴ち上げ、インフラ環境の構築も担当 チームが⾏う 21

Slide 22

Slide 22 text

SmartHRのプロダクトの特徴 💡そうは⾔っても各チームが⾃助努⼒で  がんばる、は無理がある部分も出てきた ● より適したインフラ構成の模索 ● 各プロダクトが共通で利⽤するTerraformモジュールな ど「誰の持ち物でもない」けれど利⽤しているインフラ 関連の課題に対してオーナーシップが持ちにくい状態 ● 信頼性に関する品質向上の取り組み 22

Slide 23

Slide 23 text

SmartHRのプロダクトの特徴 💡「SRE」組織を⽴ち上げましょう ● 時はきた ○ 2023年後半に体制の検討 ○ 2024年1⽉から「SRE」組織の組成 23

Slide 24

Slide 24 text

今⽇のテーマ 1. SRE⽴ち上げの背景 2. SRE⽴ち上げで気をつけたポイント 3. SREのいま

Slide 25

Slide 25 text

SRE⽴ち上げで気をつけたポイント

Slide 26

Slide 26 text

SRE組織の⽴ち上げ 💡「SRE」組織を⽴ち上げるぞ ● 「プロダクトを開発しているチームの⾃律性と能⼒向上」 を重視したい ● いわゆるイネイブリングチームとしてのSRE 󰢄 インフラ構築の代⾏ 󰢄 ミドルウェアやフレームワークのアップデート 26

Slide 27

Slide 27 text

SRE組織の⽴ち上げ 27 💡 SRE組織の⽴ち上げ ● 私がSRE組織のマネージャーとして就任 ● プロダクト開発チームからSREを希望しているメンバー を1名アサイン

Slide 28

Slide 28 text

SRE組織の⽴ち上げ 28 💡 致命的な課題

Slide 29

Slide 29 text

SRE組織の⽴ち上げ 29 💡 致命的な課題 SRE経験者がいない

Slide 30

Slide 30 text

💡どうしよ ● 課題に着⼿できるイメージはあるものの…… ○ ベースとなる考え⽅がふわふわしてる ● 課題感はあるが、⽬の前の「気がついた」ことベースで 課題に取り組むだけだと中⻑期的な課題と向き合うの が難しいのでは? SRE組織の⽴ち上げ 30

Slide 31

Slide 31 text

💡ぜったい避けたいこと ● ⽬の前の課題解決に集中してしまい、各プロダクトの成 ⻑に寄与できないこと ● インフラや信頼性が課題となって事業成⻑の⾜枷となっ てしまうこと ● 他のチームから「インフラやってくれる⼈」と思われる こと ○ SREの定義は会社によって千差万別なので SRE組織の⽴ち上げ 31

Slide 32

Slide 32 text

💡たったひとつの冴えたやりかた ● 有識者に頼ろう!(それはそう) SRE組織の⽴ち上げ 32

Slide 33

Slide 33 text

💡たったひとつの冴えたやりかた ● 有識者に頼ろう!(それはそう) SRE組織の⽴ち上げ 33 中⻑期のロードマップやSREとしての⽅針‧期待値など 整えていかないといけないが、体系⽴てて考えるための知⾒ が不⾜していた ポイント

Slide 34

Slide 34 text

💡有識者 is ● 株式会社Topotal の@rrreeeyyy さんが相談に乗ってい ただけることに 本当にお世話になっております🙏 SRE組織の⽴ち上げ 34

Slide 35

Slide 35 text

💡⾒えてきた基本⽅針 ● rrreeeyyy さんにSREの⽅針を相談している中で教えて もらったリソース ○ What’s your org’s reliability mindset? Insights from Google SREs SRE組織の⽴ち上げ 35

Slide 36

Slide 36 text

💡What’s your org’s reliability mindset? Insights from Google SREs ● Googleで信頼性に関する活動から⾒出された 信頼性を表す5つの分類 ○ absent, reactive, proactive, strategic, visionary SRE組織の⽴ち上げ 36

Slide 37

Slide 37 text

💡我々のプロダクトの段階は? ● 多くのプロダクトはreactiveな段階だということがわ かった ○ 信頼性に関するメトリクスやアラートの設定はある ○ ポストモーテムの作成や再発防⽌策も取れている ○ しかし、潜在的な課題解決など⻑期的な投資を計画 的には⾏えていない SRE組織の⽴ち上げ 37

Slide 38

Slide 38 text

💡信頼性に関するレベルを上げたい ● 潜在的なリスクの把握や課題解決の優先付けができる状 態にすることで、障害など信頼性を損ねる前に解決でき る状態が良い ● つまり、問題が起きる前に解決できるような、 proactiveな状態を⽬指したい SRE組織の⽴ち上げ 38

Slide 39

Slide 39 text

💡課題に気がつけるようにするためには ● 各プロダクトのアラート設定の整備 ● SLOの導⼊ ○ 信頼性の可視化 ○ 課題解決へ向けた投資のバランス SRE組織の⽴ち上げ 39

Slide 40

Slide 40 text

💡課題に気がつけるようにするためには ● 各プロダクトのアラート設定の整備 ● SLOの導⼊ ○ 信頼性の可視化 ○ 課題解決へ向けた投資のバランス SRE組織の⽴ち上げ 40 SRE⽴ち上げ当時からSLOの導⼊は検討していたが、 rrreeeyyy さんのアドバイスやGoogleのドキュメントを読むことでSLOの導 ⼊‧推進する際のベースとなる考え⽅を⼿に⼊れることができた

Slide 41

Slide 41 text

💡詳しくはテックブログにも書きました! SRE組織の⽴ち上げ 41

Slide 42

Slide 42 text

💡ぜったい避けたいこと(再掲) ● ⽬の前の課題解決に集中してしまい、各プロダクトの成 ⻑に寄与できないこと ● インフラや信頼性が課題となって事業成⻑の⾜枷となっ てしまうこと ● 他のチームから「インフラやってくれる⼈」と思われる こと ○ SREの定義は会社によって千差万別なので SRE組織の⽴ち上げ 42

Slide 43

Slide 43 text

💡SRE組織⽴ち上げで取り組んだポイント ● インセプションデッキを作成してSREチーム内での役割 や期待値の整理 ● ロードマップの作成 SRE組織の⽴ち上げ 43

Slide 44

Slide 44 text

💡SRE組織⽴ち上げで取り組んだポイント ● インセプションデッキを作成してSREチーム内での役割 や期待値の整理 ● ロードマップの作成 SRE組織の⽴ち上げ 44

Slide 45

Slide 45 text

💡インセプションデッキ インセプションデッキを作ろう “インセプションデッキは、プロダクトづくりに関わるメンバーが各々の意⾒を持ち 寄って共通認識をつくり出すための⼤事な質問、もしくは対話の場を指す。インセプ ションデッキの内容は10個の⼿ごわい質問(タフクエッション)で構成される。 チーム⽴ち上げ時期やプロダクトの⽅向性を⾒直すタイミングで質問の解となるデッキ (スライド)をメンバーと対話しながら作成や更新を⾏う。インセプションデッキは書 籍『アジャイルサムライ』の中でJonathan Rasmussonによって紹介された。” インセプションデッキ | Agile Studio 45 アジャイルサムライ ――達人開発者 への道 | コンピュータ・一般書 ,プロ グラミング・開発 ,開発技法 | Ohmsha

Slide 46

Slide 46 text

インセプションデッキを作ろう 💡10個の⼿ごわい質問(1) ● 我々はなぜここにいるのか? ● エレベーターピッチ ● パッケージデザイン ● やらないことリスト ● 「ご近所さん」を探せ(プロジェクトコミュニティ) 46

Slide 47

Slide 47 text

インセプションデッキを作ろう 💡10個の⼿ごわい質問(2) ● 解決案を描く(ざっくりアーキテクチャ図) ● 夜も眠れなくなるような問題は何だろうか?(リスク) ● 期間を⾒極める ● 何を諦めるのかはっきりさせる(トレードオフスライダー) ● 何がどれだけ必要なのか 47

Slide 48

Slide 48 text

💡インセプションデッキの狙い ● チーム内で共通認識を作成するため ● チームビルディングのため インセプションデッキを作ろう 48

Slide 49

Slide 49 text

💡インセプションデッキを作ろう ● いくつかの質問はスキップしつつも我々がどう考えてい るのかを⾔語化する インセプションデッキを作ろう 49 当時作成したインセプション デッキから抜粋

Slide 50

Slide 50 text

💡SRE組織⽴ち上げで取り組んだポイント ● インセプションデッキを作成してSREチーム内での役割 や期待値の整理 ● ロードマップの作成 SRE組織の⽴ち上げ 50

Slide 51

Slide 51 text

💡ロードマップの狙い ● 半期の計画を⽴てる ● 本当に解決すべき課題は何か?をブラさないため ● 注⼒するポイントや成果の現在地を把握しやすくするた め ロードマップを作ろう 51

Slide 52

Slide 52 text

💡ロードマップを作ろう ● 「やりたいこと」はたくさん出るので、それを体系⽴て てアラインしたい ● 「Google Cloud Well-Architected Framework」を ベースに「やりたいこと」「やること」を整理 ロードマップを作ろう 52 https://cloud.google.com/architecture/framework?hl=ja

Slide 53

Slide 53 text

💡Google Cloud Well-Architected Framework ロードマップを作ろう 53 https://cloud.google.com/architecture/framework?hl=ja

Slide 54

Slide 54 text

💡ロードマップ ● 5つの柱をベースにしつつ、重要度や緊急度を鑑みて 「やること」を整理 ロードマップを作ろう 54

Slide 55

Slide 55 text

💡SREチームの期待値や⽅針を決められた ● SREチームとしても認識が揃ったので注⼒するポイント を⾒失わなかった ● 関係するプロダクト開発チームにとっても、SREチーム に対する期待値を揃えられたのでスムーズなやりとりが できた やったぜ😉 SREの⽅針決め 55

Slide 56

Slide 56 text

今⽇のテーマ 1. SRE⽴ち上げの背景 2. SRE⽴ち上げで気をつけたポイント 3. SREのいま

Slide 57

Slide 57 text

SREのいま

Slide 58

Slide 58 text

SREのいま ‼SREのメンバー数 58

Slide 59

Slide 59 text

SREのいま 💡少⼈数でどのように改善していくか ● 全てのプロダクトの設定をSRE主導で変えてい くのはたいへん ● 変更理由や背景を伝え、各プロダクトチーム が変更しやすい状況を作りつつ設定変更をお 願いしていく ○ 知⾒や設計思想の共有にもなる 59

Slide 60

Slide 60 text

SREのいま 💡「レバレッジ」を意識した活動 ● SLOを幅広く導⼊できる⼯夫 ● オーナーシップ不在だったTerraformモ ジュール群やアラート設定の整理 ● 過剰だったCloud SQLバックアップ数の適 正化をはじめとするコスト削減 60

Slide 61

Slide 61 text

SREのいま 💡そうは⾔っても2名でやれんのか ● やりたいけど⼿が⾜りない部分もたくさん ある ● そんな状況でも取捨選択しながら組織とし て重要度の⾼いことに絞って成果を積み上 げています 61

Slide 62

Slide 62 text

SREのいま 💡「やる」ために ● 信頼性を測るための⼤きな⼀歩となるSLO の導⼊は⼯夫していかないと難しい ● それを進めるにはどうしたら良いか 62

Slide 63

Slide 63 text

どうやってマルチプロダクトにSLOを導⼊したか? 💡詳しくはこちらのセッションをご覧ください! 63 https://sre-next.dev/2025/schedule/#slot060

Slide 64

Slide 64 text

どうやってマルチプロダクトにSLOを導⼊したか? 💡詳しくはこちらのセッションをご覧ください! 64 https://sre-next.dev/2025/schedule/#slot060 これから!

Slide 65

Slide 65 text

SRE組織の今後 💡2名で充⾜している? ● ぜんぜん⾜りてない!!!1 ● SLOの導⼊など、「いまやっていること」を広 げていく点でも不⾜している ● より各プロダクトに寄り添った⽀援をしてい きたいけれど、「浅く広く」にならざるを得 ない 65

Slide 66

Slide 66 text

SRE組織の今後 💡いまはイネイブリングが中⼼だけど ● マルチプロダクトという戦略上、「新規プロダク トの⽴ち上げ」もレバレッジが効くポイント ● 初期のインフラ構築、CI/CD環境の設定をよりス ムーズにするためプラットフォームエンジニアリ ングっぽいものも⼒を⼊れていきたい ● やりたいこと⼤盛 66

Slide 67

Slide 67 text

SmartHRでは SREを積極採⽤中 です!!!!!!1 67

Slide 68

Slide 68 text

68 https://open.talentio.com/r/1/c/s marthr/pages/98449

Slide 69

Slide 69 text

提供🍱 SmartHR

Slide 70

Slide 70 text

SRE NEXTに参加しているSmartHRの社員は↓ のパーカーを着ているので、SREについて、イ ンフラについてなど気になることがあればぜひ お声がけください😃 70

Slide 71

Slide 71 text

SmartHRでは SREを積極採⽤中 です!!!!!!1 71