Slide 1

Slide 1 text

2025/10/31 ゆるSRE勉強会 #13 SREのキャリアから経営に近づく - Enterprise Risk Managementを基に - 山原 崇史(@shonansurvivors)

Slide 2

Slide 2 text

自己紹介 SRE出身で、現在はスタートアップの執行役員( SRE/コーポレートIT/セキュリティの領域を担当) 1人目SRE (2022年〜) EM for SRE (2023年〜) 執行役員 (2024年〜) 他社SRE (2019年〜) SIer (20xx年〜)

Slide 3

Slide 3 text

経営会議のテーマ 一例として... ● 事業をどう進めるか ● 会社のお金のこと ● 組織や人事のこと ● 技術的なこと ○ AI ○ セキュリティ

Slide 4

Slide 4 text

Site Reliability Engieeringは? ● 経営会議で、Site Reliability Engineeringを”直接的”に深く話すことは現状ない ● SRE出身の役員としては、その知識や経験を経営に活かしたいところ ● ただ、Site Reliability Engineeringを他の役員にもわかりやすく説明できるだろうか?

Slide 5

Slide 5 text

本日のテーマ SREのキャリアから経営に近づく

Slide 6

Slide 6 text

SREのキャリアから経営に近づく ● SREが、SREの言葉を直接的に使わなくても経営層と対話できるのではないか 、という仮説/提案 ● どう役に立つ? ○ SREから経営層に進む人に ○ 現場のSREとしてSite Reiliability Engineeringに関連した話を経営層とする時 に(※) ※CTOを通じて理解してもらう、 CTOに理解してもらえていれば充分という考え方ももちろんありますが  今回はそれは考えないこととします 🙏

Slide 7

Slide 7 text

SLO(サービスレベル目標) SLOを引き上げると...(99.9% → 99.99% → 99.999% → …) 😊💦信頼性は上がる (目標通り上げられれば ...) 😫運用コストが増える (金銭的/人的/時間的コスト) 😫サービス停止しての メンテナンスが 行いにくくなる ↓ 中長期的な信頼性維持に 悪影響の恐れ 😫機能のデリバリーが 停滞しやすくなる (エラーバジェットが 枯渇しやすくなるので) ↓ 機能を望むユーザーの 期待に反する恐れ

Slide 8

Slide 8 text

エラーバジェットポリシー ● エラーバジェット枯渇時 の、信頼性回復のために取るべきアクションの方針 ● リリース凍結を伴うならば、 サービスや事業へのインパクトは大きい ● ビジネス側や、場合によっては経営層も巻き込んでおくべきテーマ

Slide 9

Slide 9 text

リスクマネジメントについて ● なぜリスクマネジメントの話? ● 経営層にとっても馴染みのある概念、言葉

Slide 10

Slide 10 text

リスクとは ● リスク = 不幸な出来事、はちょっと違う ● 何か目標を決めることで初めてリスクが生まれる ● 家から外出して買い物をする、という目標を立てたら ... ○ 雨が降る、という出来事はリスクになる ○ 買い物せず家にいるのであれば、雨が降ることはリスクにはならない ● 出来事の結果(雨で体が濡れる)と、 起こりやすさ(雨の降る確率)の組み合わせがリスク ※ちなみに後述する ERMでは、良いこともリスクと呼ぶそうです。以前は「機会」と呼ばれていました。

Slide 11

Slide 11 text

リスクマネジメントとは ● 組織が目標を達成するため に、リスクをマネジメント する ● リスクゼロの完璧を目指すわけではない ○ リスクゼロを目指すことは、その実現に 多大なコストがかかる可能性がある ※目標自体を諦めることでリスクゼロにするという対応を取る場合もある(リスク回避)。ただし、この場合はリターンも一切ない。 リスクマネジメントはリスクゼロの完璧は 
 目指さない...。
 
 SLOも100%の完璧は目指さない...。 


Slide 12

Slide 12 text

Enterprise Risk Management(ERM)について ● 全社的なリスクマネジメント ● アメリカのCOSOという団体が提唱 ● ERMは機能でもどこかの部門だけがやるものでもなく、 文化、能力および実践、とされる ※参考)COSO ERM 2017 Executive Summary ERMは文化...。
 
 Site Reliability Engineeringも文化...。 


Slide 13

Slide 13 text

リスク選好(Risk Apetite)について ERMには、リスク選好(Risk Apetite)という概念が登場する ● Apetiteの意味は食欲 ● どれぐらいのリスクを取っていくか、という経営の姿勢・方針 ● 会社の戦略策定と同時に定義することが求められる ほどの重要な概念 ※参考)COSO ERM 2017 Executive Summary、G20/OECDコーポレート・ガバナンス原則

Slide 14

Slide 14 text

Site Reliability EngineeringとERMの接続 サービスの特性 組織的条件・制約 (人員の成熟度など) 関係者の期待 技術的条件・制約 SLOやエラーバジェットポリシー

Slide 15

Slide 15 text

Site Reliability EngineeringとERMの接続 サービスの特性 組織的条件・制約 (人員の成熟度など) 関係者の期待 技術的条件・制約 企業の文化 戦略と目標 (追求する 成長速度やリターン) 事業環境・特性 SLOやエラーバジェットポリシー

Slide 16

Slide 16 text

Site Reliability EngineeringとERMの接続 サービスの特性 組織的条件・制約 (人員の成熟度など) 関係者の期待 技術的条件・制約 企業の文化 戦略と目標 (追求する 成長速度やリターン) 事業環境・特性 リスク選好(Risk Apetite) SLOやエラーバジェットポリシー

Slide 17

Slide 17 text

つまり... 経営層との対話において ● SREが、SREの言葉を直接的に使って経営層と会話するのは大変かもしれないが、 ERMやリスク選好といった経営層の言葉を通じてなら対話しやすい のかもしれない 経営という行為との関係性 ● Site Rieliability Engineering自体が、ERMのリスク選好と地続きの 経営的な行為なのでは?

Slide 18

Slide 18 text

本日のテーマ SREのキャリアから経営に近づく

Slide 19

Slide 19 text

本日のテーマ SREのキャリアから経営に近づく は