Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SRE NEXT 2024 スライドみただけの感想 / Just a quick look a...
Search
kyonmm
PRO
August 19, 2024
Technology
2
450
SRE NEXT 2024 スライドみただけの感想 / Just a quick look at the slides for SRE NEXT 2024
https://note.com/kyon_mm/n/n47027f0c270b
にて話している様子も公開しています
kyonmm
PRO
August 19, 2024
Tweet
Share
More Decks by kyonmm
See All by kyonmm
フレームワークを生み出すメタフレームワークという考え方 -適応型から生成型へ- #RSGT2025 / From adaptive to generative
kyonmm
PRO
2
2.1k
Living Process #RSGT2024
kyonmm
PRO
3
2.5k
アジャイルクイズ王 2024 #RSGT2024 / agile quiz king 2024
kyonmm
PRO
0
140
プロダクトマネジメントのグローバルトレンド #pmconf2023 / Global Trends in Product Management
kyonmm
PRO
3
6.9k
スタートアップのためのアジャイルプラクティス -論文100本ノック- #xpjug / Agile Practice for Startup - Papers -
kyonmm
PRO
4
2k
アジャイルリーダークイズ王 2023 #scrummikawa / agile leader quiz king 2023
kyonmm
PRO
1
1.3k
アジャイルテストクイズ王2023 #scrumniigata / agile test quiz king
kyonmm
PRO
0
810
アジャイルコーチクイズ王 2023 #scrumfukuoka
kyonmm
PRO
0
2.2k
Living Management -Good bye Scrum, Hello Semilattice- #RSGT2023
kyonmm
PRO
1
8.2k
Other Decks in Technology
See All in Technology
三菱電機で社内コミュニティを立ち上げた話
kurebayashi
1
340
データ基盤におけるIaCの重要性とその運用
mtpooh
1
170
AWSマルチアカウント統制環境のすゝめ / 20250115 Mitsutoshi Matsuo
shift_evolve
0
100
JAWS-UG20250116_iOSアプリエンジニアがAWSreInventに行ってきた(真面目編)
totokit4
0
130
RubyでKubernetesプログラミング
sat
PRO
4
150
#TRG24 / David Cuartielles / Post Open Source
tarugoconf
0
550
Oracle Base Database Service:サービス概要のご紹介
oracle4engineer
PRO
1
16k
あなたの知らないクラフトビールの世界
miura55
0
100
EMConf JP の楽しみ方 / How to enjoy EMConf JP
pauli
2
140
Godot Engineについて調べてみた
unsoluble_sugar
0
340
Formal Development of Operating Systems in Rust
riru
1
420
完全自律型AIエージェントとAgentic Workflow〜ワークフロー構築という現実解
pharma_x_tech
0
310
Featured
See All Featured
How to train your dragon (web standard)
notwaldorf
89
5.8k
A Modern Web Designer's Workflow
chriscoyier
693
190k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.4k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
YesSQL, Process and Tooling at Scale
rocio
170
14k
Speed Design
sergeychernyshev
25
730
The Power of CSS Pseudo Elements
geoffreycrofte
74
5.4k
Fireside Chat
paigeccino
34
3.1k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.5k
Visualization
eitanlees
146
15k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.8k
Transcript
SRE NEXT 2024 スライドみただけの感想 kyon_mm
2
SRE NEXT 2024はソフトウェアサービス の信頼性に関するカンファレンス • 信頼性に関するプラクティスに深い関心を持つエンジニアのた めのカンファレンスです。 同じくコミュニティベースのSRE勉 強会である「SRE Lounge」のメンバーが中心となり運営・開催
されます。 SRE NEXT 2024のテーマは「Beyond NEXT」です。 SRE NEXT 2023で掲げた価値観 Diversity、Interactivity、 Empathyを大切にしつつ、SREの担う幅広い技術領域のトピック や組織、人材育成に対してディスカッションやコミュニケー ションを通じて、新たな知見や発見を得られる場にします。 3 引用:https://sre-next.dev/2024/
公開されているスライドは28/37 ※2024/08/19時点 • ほとんどがSpeakerdeckに公開されている • SRE NEXT 2024公式サイトにはまとめる仕組みがないので、ま とめブログなどを参考になる •
公開されているスライドは全て日本語である • キーノートのスライドが見当たらなかったが、英語で話しながらスラ イドは日本語だったとXのポストが存在した 4
以降はすべてkyon_mmの判断であり、業 界標準の基準などは利用していない • 以降ではスライドを4象限に分類しながら感想をまとめた • 4象限の作り方や判断基準は定性的なもの & SREではない kyon_mmがスライドを読んだだけで判断したものである &
スラ イドの有用性の評価ではない • この感想の次のSTEPとしてはcatchpoint社が提供しているSRE Report 2021から2024くらいまでによるグローバルトレンドと コミュニティの課題感の比較からの分析をしてみたい 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 6 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 7 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み 1 9 13 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 8 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 独立型SRE] 1/2 • カンファレンスとして必要なコンテンツを取り揃えてあるよう に思う。 • 「基本事項をおさらいしながら自社サービスや取り組み」を紹 介するというスポンサーセッションはお手本のように感じる
(運営側がほしいセッションにおもう) • FourKeys導入失敗のように陥りがちな失敗事例があるのも、社 内での理解醸成のために必要なコンテンツとして使いやすい。 9
[基本的な技術 × 独立型SRE] 2/2 • SREという話をするためにはどのような事業なのか(どういう ユーザー体験とスペックを保つように仕事をしているのか)を 話す必要があるというのは、企業のエミネンス活動としてもよ くできているコミュニティだとおもう。 •
SREの各書籍に書かれているような内容をどうやって自分たち の仕事に落とすのかがわかりやすいセッションが多かったよう におもう。 10
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 11 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 独立型SRE] • SRE系のツールでのAI活用は相性がよさそうな領域ゆえにいろ んな可能性を妄想できるスライドだった。 • 自動化できる範囲もそうだが、バディとしてのAIの活用が有用な領域 におもう。 •
SREの高度な技術というのがどうしても標準とか複数プロダク トをどう扱うか?みたいなところになりがちなので、もっと 尖った話をきいてみたいとおもう。 • Instagramは数十名で回していたよねみたいなときに必要なSREって結 構尖ったことをやっていたと思う。 12
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 13 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 横断型SRE] 1/2 • 横断型のSREチームになる過程もふくめてセッションがとりそ ろっていていろんな人にとって聞きやすかったとおもう。 • 工学としてのSRE再訪のようなキーノートのようなセッション もあってコミュニティの分厚さを感じた。
• いわゆるデジタルSaaS企業以外のセッションだとSRE導入の難 しさみたいな話になるのは、本当にそうなんだと思うが、普通 にやっているよ?くらいのテンションのセッションがもっとあ ると全体としてよくなる気がした。 14
[基本的な技術 × 横断型SRE] 2/2 • インシデント対応の成熟度モデルのような普遍的な話を2024文 脈で整理してあるのは今後のAI活用という文脈でも重要なセッ ションにおもえた。CNCFも成熟度モデルをだしたりしているわ けだけど、どのように発展していくのか楽しみ。 •
一番セッションが多かったのもあるが、事業のいろんなフェー ズの話が混ざっていたとおもう。 15
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 16 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 統合型SRE] • 大規模なデータや事業を支えるためにある程度高度な方法につ いての解説が全体の20%くらいあったのはバランスがよかった のかもしれない?(ほんとうか?) • この規模の話をしているのにディスクレーマーが少ないスライ ドなのがコミュニティの若さをかんじてよかった
• 意外と当たり前のことだったりするんだけど、まともに全部や るんだよっていう感じなのも好感をもてるスライドがおおかっ た。 17
自分たちが向き合っている製品の数や成長度 合いによってどの知見を使うのかが分かれる 18 横断的 独立 基本的な技術 高度な技術 1つの製品で高度なスキルを実践するSRE組織 1つの製品で基本的なスキルを実践するSRE組織 複数の製品で基本的なスキルを実践するSRE組織
複数の製品で高度なスキルを実践するSRE組織
全体の感想 • 技術的な話から組織的な話まであっていろんな人が参加しやすいカンファ レンスに見える • 生成AIの話がすくなくて残念だったが、これはいま多くの組織が試行錯誤 中だということを示唆しているのか? • スライドになっていないパネルディスカッションの「SREの技術トレンド2024」で話 されたのかも?
• SREにおけるタスク管理とかチーム活動みたいなそういった部分について あんまり見れなかったのがちょっと残念だった • 働き方的なところをもう少し知りたかった • SREはいかに低コストで安全にやっていくのか?というところであまり実 験じみたことをやる人たちがいないのかもしれない?結果として、[基本X 独立]->[基本X横断]->[高度X横断]というパスがよいということか? • 世界のどこかで[高度X独立]をやっているとおもうんですが、めったにいないのかも しれない 19