古今東西SRE

SITE RELIABILITY ENGINEERING 古今東西SRE 〜日本とアメリカの SREの流行と広がり〜 SREcon と SRE NEXT
で辿る12年の系譜 2014 → 2026

ABOUT THE SPEAKER 2 / 23 自己紹介名前織田薫
(かおる) 会社株式会社 Voicy 職業ペンギン好き SRE X (Twitter) 右の画像で探してください

ABOUT VOICY 3 / 23 株式会社 Voicy スマートフォン一台で完結する音声プラットフォームパーソナリティ発信者
▪ 審査通過者のみチャンネル開設可能 ▪ スマートフォン一台で音声配信 ▪ 編集なし、ありのままのコンテンツ ▪ エンゲージメントによるマネタイズリスナー受信者 ▪ 通勤中・家事中など「ながら聴き」 ▪ 好きな音声をさまざまな場所で聴取 ▪ 配信者へのコメント等のインタラクション ▪ 配信音声のシェア

AGENDA 4 / 23 本日の流れ 01 SREの起源と二つのカンファレンス SREcon (2014) と
SRE NEXT (2020) の生い立ち 02 年代別の流行と話題黎明期から AI 元年まで、年ごとの中心テーマ 03 日米の関心テーマの差異技術哲学・組織論・ツールへの重みの違い 04 同期と収束、これからの SRE AI・コスト・包摂性へ向かう共通課題

ORIGIN 5 / 23 SREという概念の起源 Googleが社内実践を体系化し、業界に広がった 2003 Google SRE発足 Ben
Treynor Sloss が「ソフトウェアエンジニアリングをオペレーション課題に適用」 2014 SREcon Americas USENIXが業界カンファレンスとしてスタート (於 Santa Clara) 2016 SRE本出版 O'Reilly 『How Google Runs Production Systems』カンファレンス参加者の多くが当初は Google 社員だった時代

TWO CONFERENCES 6 / 23 グローバルと日本、二つの場 SREcon 主催 USENIX (米国)
初回 2014年 / Santa Clara 地域 Americas / EMEA / APAC 特徴技術深掘りと哲学的議論強み Resilience Engineering系譜 SRE NEXT 主催 SRE Lounge / 一般社団法人初回 2020年1月 / 豊洲地域東京中心 (Road to SRE NEXT) 特徴実践事例と組織論強み Embedded / Enabling SRE

TIMELINE 7 / 23 12年の流れを一望する 2014 2016 2018 2020 2022
2024 2026 USA SREcon 始動 USA Brooklyn 人間側 USA パンデミック対応・自省 USA Tradeoffs USA Convergence JPN SRE NEXT 始動 JPN オンライン再開 JPN Diversity Interactivity JPN Talk NEXT AI元年 JPN Inclusive SRE 黎明期 → 哲学化 → 組織論 → AI同期 → 包摂

PHASE 1 8 / 23 2014 — 2017 USA /
黎明期 Google 式SREの輸入と業界共有中心トピック ▪ SLO / エラーバジェットの概念導入 ▪ Toil 削減と自動化 ▪ オンコール文化 ▪ ポストモーテム / Blameless 文化 ▪ DevOpsとの関係整理業界の状況 SREconの参加者の多くがGoogle社員。「もしGoogleがやっているなら…」と業界全体が注目し、SRE本(2016)が長くO'Reillyのベストセラー1位を維持。日本ではメルカリ・ヤフー等の先行事例ブログが現れ始めるが、カンファレンスはまだ存在しない。

PHASE 2 9 / 23 2018 — 2019 USA /
人間側の確立複雑系・心理的安全性・ Resilience Engineering Black Swan Outages Laura Nolan (2018) 予測困難で重大な障害を6種類に分類。エラーバジェットを10年分吹き飛ばす可能性を提示。 No Root Cause Ryan Kitchen (2019) 「根本原因は存在しない、出来事の連鎖が完璧な嵐を起こすだけ」という認識論的転回。心理的安全性 Logan McDonald 他心理的安全性がインシデント対応速度を上げる。バーンアウト回避・学習文化が中核に。 SREconが「技術 + 人間」の両輪を語る場として確立した転換点

PHASE 3 10 / 23 2020 JPN / 日本初のSREカンファレンス SRE
NEXT 2020 — 原則を翻訳する 457 オフライン参加者 1日豊洲フロント開催 1月25日国内初SRE専業カンファレンス中心テーマ — Google SRE本の国内事例化 ▪ サイト信頼性エンジニアリングの原則 (山口能迪) ▪ メルカリのSREプラクティス: SLO・Toil・顧客満足度の三軸評価 ▪ ヤフーの 40,000 コンテナ Private PaaS SRE ▪ SLOとエラーバジェット運用の組織導入 ▪ 1日10回デプロイの実装

PHASE 4 11 / 23 2020 — 2021 USA /
パンデミック対応の二回戦レジリエンスから自省へ — オンライン 2連発当初2020年3月のSanta Clara予定 → COVIDで中止 → 12月にオンラインで再編成、翌 3月も引き続きオンライン SREcon20 / 2020年12月レジリエンスを体現する ▪ Scaling for a Pandemic — Google Meet ▪ 予期せぬ需要急増・認知負荷管理 ▪ 分散システムの深掘りデバッグ ▪ Co-chairs: Nora Jones / Mike Rembetsy SREcon21 / 2021年3月 5年振り返りと自省へ ▪ Niall Murphy 『What SRE Could Be』 ▪ 「5年でSREが達成したこと、未解決の問題、自分たちで作った問題を整理」 ▪ What's the Cost of a Millisecond? ▪ SREという分野の自省フェーズ開始日本: COVID影響でSRE NEXT 2021 休止、SRE Loungeのみオンライン継続

PHASE 5 12 / 23 2022 USA + JPN /
問い直しの年 SLO/MTTR/ エラーバジェットを問い直す USA Principled Performance Analytics Narayan Desai & Brent Bryan 「成功/失敗をbooleanでratio化する」前提を批判。ストリーミングや機械学習等の従来パラダイム外サービスでは何を測るべきか？という根本的問題提起。 JPN SRE NEXT 2022 — 受容の拡大オンライン開催・690名参加「スタートアップから大企業まで、幅広い業種・領域・フェーズ — どんなSRE Practiceであっても受け入れる」をテーマに、Google式以外のSREも認める段階に。

PHASE 6 13 / 23 2023 USA + JPN /
組織論と批判の深化 "Endgame of SRE" / Diversity ・Interactivity ・Empathy USA — SREcon23 Americas ▪ Endgame of SRE (Amy Tobey, opening keynote) ▪ Far From the Shallows — MTTR批判 (Courtney Nash) ▪ LFI (Learning From Incidents) と継続的学習文化 ▪ OpenTelemetry / 分散トレーシングの CTO論議 ▪ 適応的キャパシティ (David Woods由来) JPN — SRE NEXT 2023 (初ハイブリッド・九段会館) ▪ テーマ: Diversity / Interactivity / Empathy ▪ Embedded SRE / Enabling SRE の役割整理 ▪ Platform Engineeringとの関係 ▪ Enabling SLO の事例共有 ▪ 現地304名 + オンライン684名

PHASE 7 14 / 23 2024 USA + JPN /
SREの再定義 Tradeoffs / Beyond NEXT / Observability 2.0 SREcon 2024 のテーマ "Tradeoffs" 効率 vs 徹底・インシデント時の判断・精度とオーバーヘッド・コストとベネフィットの不均等分配 — トレードオフは技術的・組織的・社会的に多重 USA Observability 2.0 Charity Majors keynote ログ・メトリクス・トレースを別々に持たず、高カーディナリティの構造化イベント 1つに統合。アラートはSLO違反(ユーザーが感じる痛み )のみに絞る。 JPN SRE NEXT 2024 — Beyond NEXT Abema Towers / 4回目 Becoming SRE パネル(LINEヤフー・LayerX・CA・スリーシェイク)。 AI for SRE 研究(さくらインターネット研究所 )が初登場。

PHASE 8 — AI ERA 15 / 23 2025 USA
+ JPN / AI for SRE 元年 AI が全セッション横断の話題に 740 名 / SRE NEXT 2025 現地参加テーマ: Talk NEXT 過去最大規模、対話を中心に代表的なAI関連セッション ▪ SRE with AI: 実践から学ぶ運用課題解決 ▪ サイバーエージェントの SRE 10年とAI時代の生存戦略 ▪ 100% AI コード生成と信頼性ガードレール ▪ Rethinking Incident Response: Context-Aware AI ▪ 対話型音声AIアプリの信頼性向上 (IVRy) ▪ MCPサーバで始めたアラート整理の実験

PHASE 9 — TODAY 16 / 23 2026 USA +
JPN / 収束・連携と包摂への問い "Convergence" vs "Inclusive SRE" USA — SREcon26 Americas (Seattle) Convergence ▪ AI Taylorism への警戒 (A. Hatch) ▪ VMware脱出 / Edge K8s 1,400拠点 ▪ FRAM・CAST など安全工学の輸入 ▪ MTTR批判の継続的議論 ▪ LLM Observability (TikTok) JPN — SRE NEXT 2026 (TOC有明・7月) Inclusive SRE ▪ Roleを超えた「実践としての SRE」 ▪ EM・PM・SIerまで対象を拡大 ▪ DB / Platform スペシャリスト ▪ SREに取り組み始めたチームの参入路 ▪ 対話・アンカンファレンス文化の定着両者とも「SREという旗印で何を収束・連携・包摂するか」という問いに同時にたどり着いている

ANALYSIS 1 18 / 23 関心テーマの重みの違い両カンファレンスの登壇テーマ分布から見える「重心」 USA は哲学的批判と方法論の刷新が強く、日本は組織への適応・実装事例の共有が中心軸。

ANALYSIS 2 19 / 23 日米のフェーズのずれは縮んだ 2018 — 2020 3年遅れ
3年 USAは人間側・複雑系へ。日本はまだ原則の輸入段階。 2021 — 2023 1〜2年遅れ 1-2年 USAでSRE自省・MTTR批判。日本は組織論にフォーカスし軸が違う。 2024 — 2026 ほぼ同期 0年 AIで両者の関心が同期。並行して同じようなテーマを議論。 AIという共通の波が、日米の関心軸を同期させた。

SHARED CHALLENGES 20 / 23 いま両国が共通して直面する課題 01 AI と Toil
AIで効率化したつもりが、 Toilがむしろ増える逆説。 2025年版 SRE Report で運用業務中央値が 25% → 30%。 AI Taylorism への警戒も。 02 コスト合理性 VMwareライセンス10倍・クラウド請求・LLM推論コスト。 FinOpsとSREが融合し、信頼性 vs コストの判断が日常に。 03 安全工学の輸入 FRAM・CAST・Engineering a Safer World。航空・原子力など他産業の知見を SREに持ち込む流れ。複雑系を「制御」ではなく「適応」する視点。

CONCLUSION 23 / 23 まとめ 1 12年で米国は SREの前提を批判的に問い直し、日本は実装と組織論を磨いてきた 2 AIの登場で関心が同期
— 2025年に両国が AI元年を迎えた 3 2026年は「Convergence」と「Inclusive SRE」、両者とも収束・連携と包摂を問う段階 4 次の論点は AIガードレール・コスト最適化・安全工学の取り込み Thank you.

古今東西SRE

古今東西SRE

Kaoru

More Decks by Kaoru

Other Decks in Technology

Featured

Transcript

SITE RELIABILITY ENGINEERING 古今東西SRE 〜日本とアメリカの SREの流行と広がり〜 SREcon と SRE NEXT

ABOUT THE SPEAKER 2 / 23 自己紹介名前織田薫

ABOUT VOICY 3 / 23 株式会社 Voicy スマートフォン一台で完結する音声プラットフォームパーソナリティ発信者

AGENDA 4 / 23 本日の流れ 01 SREの起源と二つのカンファレンス SREcon (2014) と

ORIGIN 5 / 23 SREという概念の起源 Googleが社内実践を体系化し、業界に広がった 2003 Google SRE発足 Ben

TWO CONFERENCES 6 / 23 グローバルと日本、二つの場 SREcon 主催 USENIX (米国)

TIMELINE 7 / 23 12年の流れを一望する 2014 2016 2018 2020 2022

PHASE 1 8 / 23 2014 — 2017 USA /

PHASE 2 9 / 23 2018 — 2019 USA /

PHASE 3 10 / 23 2020 JPN / 日本初のSREカンファレンス SRE

PHASE 4 11 / 23 2020 — 2021 USA /

PHASE 5 12 / 23 2022 USA + JPN /

PHASE 6 13 / 23 2023 USA + JPN /

PHASE 7 14 / 23 2024 USA + JPN /

PHASE 8 — AI ERA 15 / 23 2025 USA

PHASE 9 — TODAY 16 / 23 2026 USA +

ANALYSIS 1 18 / 23 関心テーマの重みの違い両カンファレンスの登壇テーマ分布から見える「重心」 USA は哲学的批判と方法論の刷新が強く、日本は組織への適応・実装事例の共有が中心軸。

ANALYSIS 2 19 / 23 日米のフェーズのずれは縮んだ 2018 — 2020 3年遅れ

SHARED CHALLENGES 20 / 23 いま両国が共通して直面する課題 01 AI と Toil

CONCLUSION 23 / 23 まとめ 1 12年で米国は SREの前提を批判的に問い直し、日本は実装と組織論を磨いてきた 2 AIの登場で関心が同期