Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SRE NEXT 2024 スライドみただけの感想 / Just a quick look a...
Search
kyonmm
PRO
August 19, 2024
Technology
2
640
SRE NEXT 2024 スライドみただけの感想 / Just a quick look at the slides for SRE NEXT 2024
https://note.com/kyon_mm/n/n47027f0c270b
にて話している様子も公開しています
kyonmm
PRO
August 19, 2024
Tweet
Share
More Decks by kyonmm
See All by kyonmm
AIのグローバルトレンド2025 #scrummikawa / global ai trend
kyonmm
PRO
1
490
IT子会社のグローバルトレンド #scrumsendai / Global Trends in IT Subsidiaries
kyonmm
PRO
3
1.3k
AIのグローバルトレンド 2025 / ai global trend 2025
kyonmm
PRO
1
260
AI時代における変革の入口-100年後も語られる25年のために- #scrumosaka / The entry point to transformation in the AI era For 25 years that will be talked about 100 years from now
kyonmm
PRO
6
1.9k
地方中小企業のエンジニアから大企業の執行役員になるまで #phpcon_niigata / road to executive
kyonmm
PRO
7
15k
ソフトウェアテストのグローバルトレンド 2025 #scrumniigata / software-test global trend 2025
kyonmm
PRO
10
8.8k
Engineering Managementのグローバルトレンド #emoasis / Engineering Management Global Trend
kyonmm
PRO
6
1.4k
フレームワークを生み出すメタフレームワークという考え方 -適応型から生成型へ- #RSGT2025 / From adaptive to generative
kyonmm
PRO
4
5.1k
Living Process #RSGT2024
kyonmm
PRO
3
3.1k
Other Decks in Technology
See All in Technology
Reinforcement Fine-tuning 基礎〜実践まで
ch6noota
0
180
AWS Bedrock AgentCoreで作る 1on1支援AIエージェント 〜Memory × Evaluationsによる実践開発〜
yusukeshimizu
6
400
Database イノベーショントークを振り返る/reinvent-2025-database-innovation-talk-recap
emiki
0
150
第4回 「メタデータ通り」 リアル開催
datayokocho
0
130
因果AIへの招待
sshimizu2006
0
970
30分であなたをOmniのファンにしてみせます~分析画面のクリック操作をそのままコード化できるAI-ReadyなBIツール~
sagara
0
140
ブロックテーマとこれからの WordPress サイト制作 / Toyama WordPress Meetup Vol.81
torounit
0
570
AWS re:Invent 2025で見たGrafana最新機能の紹介
hamadakoji
0
370
Haskell を武器にして挑む競技プログラミング ─ 操作的思考から意味モデル思考へ
naoya
6
1.5k
MapKitとオープンデータで実現する地図情報の拡張と可視化
zozotech
PRO
1
140
Fashion×AI「似合う」を届けるためのWEARのAI戦略
zozotech
PRO
2
360
日本Rubyの会の構造と実行とあと何か / hokurikurk01
takahashim
4
1.1k
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Balancing Empowerment & Direction
lara
5
800
Scaling GitHub
holman
464
140k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
GitHub's CSS Performance
jonrohan
1032
470k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
How GitHub (no longer) Works
holman
316
140k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.9k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
70k
Raft: Consensus for Rubyists
vanstee
141
7.2k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Transcript
SRE NEXT 2024 スライドみただけの感想 kyon_mm
2
SRE NEXT 2024はソフトウェアサービス の信頼性に関するカンファレンス • 信頼性に関するプラクティスに深い関心を持つエンジニアのた めのカンファレンスです。 同じくコミュニティベースのSRE勉 強会である「SRE Lounge」のメンバーが中心となり運営・開催
されます。 SRE NEXT 2024のテーマは「Beyond NEXT」です。 SRE NEXT 2023で掲げた価値観 Diversity、Interactivity、 Empathyを大切にしつつ、SREの担う幅広い技術領域のトピック や組織、人材育成に対してディスカッションやコミュニケー ションを通じて、新たな知見や発見を得られる場にします。 3 引用:https://sre-next.dev/2024/
公開されているスライドは28/37 ※2024/08/19時点 • ほとんどがSpeakerdeckに公開されている • SRE NEXT 2024公式サイトにはまとめる仕組みがないので、ま とめブログなどを参考になる •
公開されているスライドは全て日本語である • キーノートのスライドが見当たらなかったが、英語で話しながらスラ イドは日本語だったとXのポストが存在した 4
以降はすべてkyon_mmの判断であり、業 界標準の基準などは利用していない • 以降ではスライドを4象限に分類しながら感想をまとめた • 4象限の作り方や判断基準は定性的なもの & SREではない kyon_mmがスライドを読んだだけで判断したものである &
スラ イドの有用性の評価ではない • この感想の次のSTEPとしてはcatchpoint社が提供しているSRE Report 2021から2024くらいまでによるグローバルトレンドと コミュニティの課題感の比較からの分析をしてみたい 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 6 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 7 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み 1 9 13 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 8 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 独立型SRE] 1/2 • カンファレンスとして必要なコンテンツを取り揃えてあるよう に思う。 • 「基本事項をおさらいしながら自社サービスや取り組み」を紹 介するというスポンサーセッションはお手本のように感じる
(運営側がほしいセッションにおもう) • FourKeys導入失敗のように陥りがちな失敗事例があるのも、社 内での理解醸成のために必要なコンテンツとして使いやすい。 9
[基本的な技術 × 独立型SRE] 2/2 • SREという話をするためにはどのような事業なのか(どういう ユーザー体験とスペックを保つように仕事をしているのか)を 話す必要があるというのは、企業のエミネンス活動としてもよ くできているコミュニティだとおもう。 •
SREの各書籍に書かれているような内容をどうやって自分たち の仕事に落とすのかがわかりやすいセッションが多かったよう におもう。 10
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 11 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 独立型SRE] • SRE系のツールでのAI活用は相性がよさそうな領域ゆえにいろ んな可能性を妄想できるスライドだった。 • 自動化できる範囲もそうだが、バディとしてのAIの活用が有用な領域 におもう。 •
SREの高度な技術というのがどうしても標準とか複数プロダク トをどう扱うか?みたいなところになりがちなので、もっと 尖った話をきいてみたいとおもう。 • Instagramは数十名で回していたよねみたいなときに必要なSREって結 構尖ったことをやっていたと思う。 12
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 13 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 横断型SRE] 1/2 • 横断型のSREチームになる過程もふくめてセッションがとりそ ろっていていろんな人にとって聞きやすかったとおもう。 • 工学としてのSRE再訪のようなキーノートのようなセッション もあってコミュニティの分厚さを感じた。
• いわゆるデジタルSaaS企業以外のセッションだとSRE導入の難 しさみたいな話になるのは、本当にそうなんだと思うが、普通 にやっているよ?くらいのテンションのセッションがもっとあ ると全体としてよくなる気がした。 14
[基本的な技術 × 横断型SRE] 2/2 • インシデント対応の成熟度モデルのような普遍的な話を2024文 脈で整理してあるのは今後のAI活用という文脈でも重要なセッ ションにおもえた。CNCFも成熟度モデルをだしたりしているわ けだけど、どのように発展していくのか楽しみ。 •
一番セッションが多かったのもあるが、事業のいろんなフェー ズの話が混ざっていたとおもう。 15
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 16 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 統合型SRE] • 大規模なデータや事業を支えるためにある程度高度な方法につ いての解説が全体の20%くらいあったのはバランスがよかった のかもしれない?(ほんとうか?) • この規模の話をしているのにディスクレーマーが少ないスライ ドなのがコミュニティの若さをかんじてよかった
• 意外と当たり前のことだったりするんだけど、まともに全部や るんだよっていう感じなのも好感をもてるスライドがおおかっ た。 17
自分たちが向き合っている製品の数や成長度 合いによってどの知見を使うのかが分かれる 18 横断的 独立 基本的な技術 高度な技術 1つの製品で高度なスキルを実践するSRE組織 1つの製品で基本的なスキルを実践するSRE組織 複数の製品で基本的なスキルを実践するSRE組織
複数の製品で高度なスキルを実践するSRE組織
全体の感想 • 技術的な話から組織的な話まであっていろんな人が参加しやすいカンファ レンスに見える • 生成AIの話がすくなくて残念だったが、これはいま多くの組織が試行錯誤 中だということを示唆しているのか? • スライドになっていないパネルディスカッションの「SREの技術トレンド2024」で話 されたのかも?
• SREにおけるタスク管理とかチーム活動みたいなそういった部分について あんまり見れなかったのがちょっと残念だった • 働き方的なところをもう少し知りたかった • SREはいかに低コストで安全にやっていくのか?というところであまり実 験じみたことをやる人たちがいないのかもしれない?結果として、[基本X 独立]->[基本X横断]->[高度X横断]というパスがよいということか? • 世界のどこかで[高度X独立]をやっているとおもうんですが、めったにいないのかも しれない 19