Upgrade to Pro — share decks privately, control downloads, hide ads and more …

古今東西SRE

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 古今東西SRE

Road to SRE NEXT 沖縄 2026/5/8

Avatar for Kaoru

Kaoru

May 08, 2026

More Decks by Kaoru

Other Decks in Technology

Transcript

  1. ABOUT THE SPEAKER 2 / 23 自己紹介 名前 織田 薫

    (かおる) 会社 株式会社 Voicy 職業 ペンギン好き SRE X (Twitter) 右の画像で探してください
  2. ABOUT VOICY 3 / 23 株式会社 Voicy スマートフォン一台で完結する音声プラットフォーム パーソナリティ 発信者

    ▪ 審査通過者のみチャンネル開設可能 ▪ スマートフォン一台で音声配信 ▪ 編集なし、ありのままのコンテンツ ▪ エンゲージメントによるマネタイズ リスナー 受信者 ▪ 通勤中・家事中など「ながら聴き」 ▪ 好きな音声をさまざまな場所で聴取 ▪ 配信者へのコメント等のインタラクション ▪ 配信音声のシェア
  3. AGENDA 4 / 23 本日の流れ 01 SREの起源と二つのカンファレンス SREcon (2014) と

    SRE NEXT (2020) の生い立ち 02 年代別の流行と話題 黎明期から AI 元年まで、年ごとの中心テーマ 03 日米の関心テーマの差異 技術哲学・組織論・ツールへの重みの違い 04 同期と収束、これからの SRE AI・コスト・包摂性へ向かう共通課題
  4. ORIGIN 5 / 23 SREという概念の起源 Googleが社内実践を体系化し、業界に広がった 2003 Google SRE発足 Ben

    Treynor Sloss が 「ソフトウェアエンジニアリングをオ ペレーション課題に適用」 2014 SREcon Americas USENIXが業界カンファレンス としてスタート (於 Santa Clara) 2016 SRE本 出版 O'Reilly 『How Google Runs Production Systems』 カンファレンス参加者の多くが当初は Google 社員だった時代
  5. TWO CONFERENCES 6 / 23 グローバルと日本、二つの場 SREcon 主催 USENIX (米国)

    初回 2014年 / Santa Clara 地域 Americas / EMEA / APAC 特徴 技術深掘りと哲学的議論 強み Resilience Engineering系譜 SRE NEXT 主催 SRE Lounge / 一般社団法人 初回 2020年1月 / 豊洲 地域 東京中心 (Road to SRE NEXT) 特徴 実践事例と組織論 強み Embedded / Enabling SRE
  6. TIMELINE 7 / 23 12年の流れを一望する 2014 2016 2018 2020 2022

    2024 2026 USA SREcon 始動 USA Brooklyn 人間側 USA パンデミック 対応・自省 USA Tradeoffs USA Convergence JPN SRE NEXT 始動 JPN オンライン 再開 JPN Diversity Interactivity JPN Talk NEXT AI元年 JPN Inclusive SRE 黎明期 → 哲学化 → 組織論 → AI同期 → 包摂
  7. PHASE 1 8 / 23 2014 — 2017 USA /

    黎明期 Google 式SREの輸入と業界共有 中心トピック ▪ SLO / エラーバジェット の概念導入 ▪ Toil 削減と自動化 ▪ オンコール文化 ▪ ポストモーテム / Blameless 文化 ▪ DevOpsとの関係整理 業界の状況 SREconの参加者の多くがGoogle社員。「もしGoogleが やっているなら…」と業界全体が注目し、SRE本(2016)が 長くO'Reillyのベストセラー1位を維持。 日本ではメルカリ・ヤフー等の先行事例ブログが現れ始 めるが、カンファレンスはまだ存在しない。
  8. PHASE 2 9 / 23 2018 — 2019 USA /

    人間側の確立 複雑系・心理的安全性・ Resilience Engineering Black Swan Outages Laura Nolan (2018) 予測困難で重大な障害を6種類に 分類。エラーバジェットを10年分吹 き飛ばす可能性を提示。 No Root Cause Ryan Kitchen (2019) 「根本原因は存在しない、出来事の 連鎖が完璧な嵐を起こすだけ」とい う認識論的転回。 心理的安全性 Logan McDonald 他 心理的安全性がインシデント対応 速度を上げる。バーンアウト回避・ 学習文化が中核に。 SREconが「技術 + 人間」の両輪を語る場として確立した転換点
  9. PHASE 3 10 / 23 2020 JPN / 日本初のSREカンファレンス SRE

    NEXT 2020 — 原則を翻訳する 457 オフライン参加者 1日 豊洲フロント開催 1月25日 国内初SRE専業カンファレンス 中心テーマ — Google SRE本の国内事例化 ▪ サイト信頼性エンジニアリングの原則 (山口能迪) ▪ メルカリのSREプラクティス: SLO・Toil・顧客満足度の三軸評価 ▪ ヤフーの 40,000 コンテナ Private PaaS SRE ▪ SLOとエラーバジェット運用の組織導入 ▪ 1日10回デプロイの実装
  10. PHASE 4 11 / 23 2020 — 2021 USA /

    パンデミック対応の二回戦 レジリエンスから自省へ — オンライン 2連発 当初2020年3月のSanta Clara予定 → COVIDで中止 → 12月にオンラインで再編成、翌 3月も引き続きオンライン SREcon20 / 2020年12月 レジリエンスを体現する ▪ Scaling for a Pandemic — Google Meet ▪ 予期せぬ需要急増・認知負荷管理 ▪ 分散システムの深掘りデバッグ ▪ Co-chairs: Nora Jones / Mike Rembetsy SREcon21 / 2021年3月 5年振り返りと自省へ ▪ Niall Murphy 『What SRE Could Be』 ▪ 「5年でSREが達成したこと、未解決の問題、自分た ちで作った問題を整理」 ▪ What's the Cost of a Millisecond? ▪ SREという分野の自省フェーズ開始 日本: COVID影響でSRE NEXT 2021 休止、SRE Loungeのみオンライン継続
  11. PHASE 5 12 / 23 2022 USA + JPN /

    問い直しの年 SLO/MTTR/ エラーバジェットを問い直す USA Principled Performance Analytics Narayan Desai & Brent Bryan 「成功/失敗をbooleanでratio化する」前提を批判。スト リーミングや機械学習等の従来パラダイム外サービスで は何を測るべきか?という根本的問題提起。 JPN SRE NEXT 2022 — 受容の拡大 オンライン開催・690名参加 「スタートアップから大企業まで、幅広い業種・領域・ フェーズ — どんなSRE Practiceであっても受け入れる」 をテーマに、Google式以外のSREも認める段階に。
  12. PHASE 6 13 / 23 2023 USA + JPN /

    組織論と批判の深化 "Endgame of SRE" / Diversity ・Interactivity ・Empathy USA — SREcon23 Americas ▪ Endgame of SRE (Amy Tobey, opening keynote) ▪ Far From the Shallows — MTTR批判 (Courtney Nash) ▪ LFI (Learning From Incidents) と継続的学習文化 ▪ OpenTelemetry / 分散トレーシングの CTO論議 ▪ 適応的キャパシティ (David Woods由来) JPN — SRE NEXT 2023 (初ハイブリッド・九段会 館) ▪ テーマ: Diversity / Interactivity / Empathy ▪ Embedded SRE / Enabling SRE の役割整理 ▪ Platform Engineeringとの関係 ▪ Enabling SLO の事例共有 ▪ 現地304名 + オンライン684名
  13. PHASE 7 14 / 23 2024 USA + JPN /

    SREの再定義 Tradeoffs / Beyond NEXT / Observability 2.0 SREcon 2024 のテーマ "Tradeoffs" 効率 vs 徹底・インシデント時の判断・精度とオーバーヘッド・コストとベネフィットの不均等分配 — トレードオフは技術的・組 織的・社会的に多重 USA Observability 2.0 Charity Majors keynote ログ・メトリクス・トレースを別々に持たず、高カーディナリティ の構造化イベント 1つに統合。 アラートはSLO違反(ユーザーが感じる痛み )のみに絞る。 JPN SRE NEXT 2024 — Beyond NEXT Abema Towers / 4回目 Becoming SRE パネル(LINEヤフー・LayerX・CA・スリーシェ イク)。 AI for SRE 研究(さくらインターネット研究所 )が初登場。
  14. PHASE 8 — AI ERA 15 / 23 2025 USA

    + JPN / AI for SRE 元年 AI が全セッション横断の話題に 740 名 / SRE NEXT 2025 現地参加 テーマ: Talk NEXT 過去最大規模、対話を中心に 代表的なAI関連セッション ▪ SRE with AI: 実践から学ぶ運用課題解決 ▪ サイバーエージェントの SRE 10年とAI時代の生存戦略 ▪ 100% AI コード生成と信頼性ガードレール ▪ Rethinking Incident Response: Context-Aware AI ▪ 対話型音声AIアプリの信頼性向上 (IVRy) ▪ MCPサーバで始めたアラート整理の実験
  15. PHASE 9 — TODAY 16 / 23 2026 USA +

    JPN / 収束・連携と包摂への問い "Convergence" vs "Inclusive SRE" USA — SREcon26 Americas (Seattle) Convergence ▪ AI Taylorism への警戒 (A. Hatch) ▪ VMware脱出 / Edge K8s 1,400拠点 ▪ FRAM・CAST など安全工学の輸入 ▪ MTTR批判の継続的議論 ▪ LLM Observability (TikTok) JPN — SRE NEXT 2026 (TOC有明・7月) Inclusive SRE ▪ Roleを超えた「実践としての SRE」 ▪ EM・PM・SIerまで対象を拡大 ▪ DB / Platform スペシャリスト ▪ SREに取り組み始めたチームの参入路 ▪ 対話・アンカンファレンス文化の定着 両者とも「SREという旗印で何を収束・連携・包摂するか」という問いに同時にたどり着いている
  16. ANALYSIS 2 19 / 23 日米のフェーズのずれは縮んだ 2018 — 2020 3年遅れ

    3年 USAは人間側・複雑系へ。日本はまだ 原則の輸入段階。 2021 — 2023 1〜2年遅れ 1-2年 USAでSRE自省・MTTR批判。日本は 組織論にフォーカスし軸が違う。 2024 — 2026 ほぼ同期 0年 AIで両者の関心が同期。並行して同じ ようなテーマを議論。 AIという共通の波が、日米の関心軸を同期させた。
  17. SHARED CHALLENGES 20 / 23 いま両国が共通して直面する課題 01 AI と Toil

    AIで効率化したつもりが、 Toilがむし ろ増える逆説。 2025年版 SRE Report で運用業務 中央値が 25% → 30%。 AI Taylorism への警戒も。 02 コスト合理性 VMwareライセンス10倍・クラウド請 求・LLM推論コスト。 FinOpsとSREが融合し、信頼性 vs コストの判断が日常に。 03 安全工学の輸入 FRAM・CAST・Engineering a Safer World。 航空・原子力など他産業の知見を SREに持ち込む流れ。 複雑系を「制御」ではなく「適応」する 視点。
  18. CONCLUSION 23 / 23 まとめ 1 12年で米国は SREの前提を批判的に問い直し、日本は実装と組織論を磨いてきた 2 AIの登場で関心が同期

    — 2025年に両国が AI元年を迎えた 3 2026年は「Convergence」と「Inclusive SRE」、両者とも収束・連携と包摂を問う段階 4 次の論点は AIガードレール・コスト最適化・安全工学の取り込み Thank you.