Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SRE NEXT 2024 スライドみただけの感想 / Just a quick look a...
Search
kyonmm
PRO
August 19, 2024
Technology
2
420
SRE NEXT 2024 スライドみただけの感想 / Just a quick look at the slides for SRE NEXT 2024
https://note.com/kyon_mm/n/n47027f0c270b
にて話している様子も公開しています
kyonmm
PRO
August 19, 2024
Tweet
Share
More Decks by kyonmm
See All by kyonmm
Living Process #RSGT2024
kyonmm
PRO
3
2.3k
アジャイルクイズ王 2024 #RSGT2024 / agile quiz king 2024
kyonmm
PRO
0
120
プロダクトマネジメントのグローバルトレンド #pmconf2023 / Global Trends in Product Management
kyonmm
PRO
3
6.7k
スタートアップのためのアジャイルプラクティス -論文100本ノック- #xpjug / Agile Practice for Startup - Papers -
kyonmm
PRO
4
1.9k
アジャイルリーダークイズ王 2023 #scrummikawa / agile leader quiz king 2023
kyonmm
PRO
1
1.2k
アジャイルテストクイズ王2023 #scrumniigata / agile test quiz king
kyonmm
PRO
0
760
アジャイルコーチクイズ王 2023 #scrumfukuoka
kyonmm
PRO
0
2.1k
Living Management -Good bye Scrum, Hello Semilattice- #RSGT2023
kyonmm
PRO
1
8.1k
スクラムクイズ王 2022 #scrumsapporo / scrum quiz king 2022
kyonmm
PRO
1
1.9k
Other Decks in Technology
See All in Technology
[FOSS4G 2024 Japan LT] LLMを使ってGISデータ解析を自動化したい!
nssv
1
210
rootlessコンテナのすゝめ - 研究室サーバーでもできる安全なコンテナ管理
kitsuya0828
3
380
iOS/Androidで同じUI体験をネ イティブで作成する際に気をつ けたい落とし穴
fumiyasac0921
1
110
10XにおけるData Contractの導入について: Data Contract事例共有会
10xinc
5
560
Security-JAWS【第35回】勉強会クラウドにおけるマルウェアやコンテンツ改ざんへの対策
4su_para
0
170
BLADE: An Attempt to Automate Penetration Testing Using Autonomous AI Agents
bbrbbq
0
290
OCI Vault 概要
oracle4engineer
PRO
0
9.7k
OCI Network Firewall 概要
oracle4engineer
PRO
0
4.1k
マルチモーダル / AI Agent / LLMOps 3つの技術トレンドで理解するLLMの今後の展望
hirosatogamo
37
12k
リンクアンドモチベーション ソフトウェアエンジニア向け紹介資料 / Introduction to Link and Motivation for Software Engineers
lmi
4
300k
適材適所の技術選定 〜GraphQL・REST API・tRPC〜 / Optimal Technology Selection
kakehashi
1
150
地理情報データをデータベースに格納しよう~ GPUを活用した爆速データベース PG-Stromの紹介 ~
sakaik
1
150
Featured
See All Featured
Statistics for Hackers
jakevdp
796
220k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Optimizing for Happiness
mojombo
376
70k
KATA
mclloyd
29
14k
Designing on Purpose - Digital PM Summit 2013
jponch
115
7k
Teambox: Starting and Learning
jrom
133
8.8k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
31
2.7k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.1k
Designing the Hi-DPI Web
ddemaree
280
34k
Gamification - CAS2011
davidbonilla
80
5k
Become a Pro
speakerdeck
PRO
25
5k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
410
Transcript
SRE NEXT 2024 スライドみただけの感想 kyon_mm
2
SRE NEXT 2024はソフトウェアサービス の信頼性に関するカンファレンス • 信頼性に関するプラクティスに深い関心を持つエンジニアのた めのカンファレンスです。 同じくコミュニティベースのSRE勉 強会である「SRE Lounge」のメンバーが中心となり運営・開催
されます。 SRE NEXT 2024のテーマは「Beyond NEXT」です。 SRE NEXT 2023で掲げた価値観 Diversity、Interactivity、 Empathyを大切にしつつ、SREの担う幅広い技術領域のトピック や組織、人材育成に対してディスカッションやコミュニケー ションを通じて、新たな知見や発見を得られる場にします。 3 引用:https://sre-next.dev/2024/
公開されているスライドは28/37 ※2024/08/19時点 • ほとんどがSpeakerdeckに公開されている • SRE NEXT 2024公式サイトにはまとめる仕組みがないので、ま とめブログなどを参考になる •
公開されているスライドは全て日本語である • キーノートのスライドが見当たらなかったが、英語で話しながらスラ イドは日本語だったとXのポストが存在した 4
以降はすべてkyon_mmの判断であり、業 界標準の基準などは利用していない • 以降ではスライドを4象限に分類しながら感想をまとめた • 4象限の作り方や判断基準は定性的なもの & SREではない kyon_mmがスライドを読んだだけで判断したものである &
スラ イドの有用性の評価ではない • この感想の次のSTEPとしてはcatchpoint社が提供しているSRE Report 2021から2024くらいまでによるグローバルトレンドと コミュニティの課題感の比較からの分析をしてみたい 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 6 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 7 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み 1 9 13 5
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 8 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 独立型SRE] 1/2 • カンファレンスとして必要なコンテンツを取り揃えてあるよう に思う。 • 「基本事項をおさらいしながら自社サービスや取り組み」を紹 介するというスポンサーセッションはお手本のように感じる
(運営側がほしいセッションにおもう) • FourKeys導入失敗のように陥りがちな失敗事例があるのも、社 内での理解醸成のために必要なコンテンツとして使いやすい。 9
[基本的な技術 × 独立型SRE] 2/2 • SREという話をするためにはどのような事業なのか(どういう ユーザー体験とスペックを保つように仕事をしているのか)を 話す必要があるというのは、企業のエミネンス活動としてもよ くできているコミュニティだとおもう。 •
SREの各書籍に書かれているような内容をどうやって自分たち の仕事に落とすのかがわかりやすいセッションが多かったよう におもう。 10
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 11 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 独立型SRE] • SRE系のツールでのAI活用は相性がよさそうな領域ゆえにいろ んな可能性を妄想できるスライドだった。 • 自動化できる範囲もそうだが、バディとしてのAIの活用が有用な領域 におもう。 •
SREの高度な技術というのがどうしても標準とか複数プロダク トをどう扱うか?みたいなところになりがちなので、もっと 尖った話をきいてみたいとおもう。 • Instagramは数十名で回していたよねみたいなときに必要なSREって結 構尖ったことをやっていたと思う。 12
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 13 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[基本的な技術 × 横断型SRE] 1/2 • 横断型のSREチームになる過程もふくめてセッションがとりそ ろっていていろんな人にとって聞きやすかったとおもう。 • 工学としてのSRE再訪のようなキーノートのようなセッション もあってコミュニティの分厚さを感じた。
• いわゆるデジタルSaaS企業以外のセッションだとSRE導入の難 しさみたいな話になるのは、本当にそうなんだと思うが、普通 にやっているよ?くらいのテンションのセッションがもっとあ ると全体としてよくなる気がした。 14
[基本的な技術 × 横断型SRE] 2/2 • インシデント対応の成熟度モデルのような普遍的な話を2024文 脈で整理してあるのは今後のAI活用という文脈でも重要なセッ ションにおもえた。CNCFも成熟度モデルをだしたりしているわ けだけど、どのように発展していくのか楽しみ。 •
一番セッションが多かったのもあるが、事業のいろんなフェー ズの話が混ざっていたとおもう。 15
技術の高度さ X 組織の範囲で分類 基本的な技術 X 横断的なSREが多数 16 横断的 独立 基本的な技術
高度な技術 • An Efficient Incident Response Training with AI • 大きな組織にSLOを導入し 運用するということ、その難しさ • 500万人が利用するYoutuber向け大規模アプリ - パラレルにおけるデータベー ス負荷の高速で改善 • SkyWayが遭遇したWebRTCの可観測性に関する問題と、開発者向け可視化サー ビス提供までの道のり • SREが抱えるハイブリッド環境の技術移行とライフサイクルにおける信頼性 • 徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 • DevSecOpsの内外における持続可能なセキュリ ティ対策 • 巨大インフラ産業で戦うSRE • オブザーバビリティのマクロからミクロまで • プロダクトのスケールによって顕在化しうるリス クをどう管理するか? • 内製化を見据えた効果的なSRE支援のアプローチ • Enabling Client-Side SLO • 複業SRE、どこまでいける? • FourKeysを導入したが生産性向上には至らな かった理由 • SREが考えるハイブリッド開催の技術イベントの ライブ配信における信頼性 • 工学としてのSRE再訪 • 組織的なインシデント対応を目指して〜成熟度評価と改善のステップ〜 • アンドパッドのマルチプロダクト戦略を支えるSRE • Central SREとEmbedded SREのハイブリッド体制:持続可能かつ最適なSRE組織 • プロダクト全体で取り組むSREing イシューから始める信頼性・生産性向上の実践 • 事業フェーズの変化を乗り越えるEnabling/Platform SREへの転換 • SRE の考えをマネジメントに活かす • スタートアップの急成長に寄り添うOn-Call体制構築とその変遷 • 敵対的SRE: 300個のジョブをAIチーム全員で支える技術 • Enabling SRE by Guide Maps • 社内留学を通じて加速するプロダクトチームとのコラボレーション • 開発チームへのディープダイブで見えてきた顧客=開発者の本当の課題/ • SRE文化の導入とプラットフォームの信頼性向上の取り組み
[高度な技術 × 統合型SRE] • 大規模なデータや事業を支えるためにある程度高度な方法につ いての解説が全体の20%くらいあったのはバランスがよかった のかもしれない?(ほんとうか?) • この規模の話をしているのにディスクレーマーが少ないスライ ドなのがコミュニティの若さをかんじてよかった
• 意外と当たり前のことだったりするんだけど、まともに全部や るんだよっていう感じなのも好感をもてるスライドがおおかっ た。 17
自分たちが向き合っている製品の数や成長度 合いによってどの知見を使うのかが分かれる 18 横断的 独立 基本的な技術 高度な技術 1つの製品で高度なスキルを実践するSRE組織 1つの製品で基本的なスキルを実践するSRE組織 複数の製品で基本的なスキルを実践するSRE組織
複数の製品で高度なスキルを実践するSRE組織
全体の感想 • 技術的な話から組織的な話まであっていろんな人が参加しやすいカンファ レンスに見える • 生成AIの話がすくなくて残念だったが、これはいま多くの組織が試行錯誤 中だということを示唆しているのか? • スライドになっていないパネルディスカッションの「SREの技術トレンド2024」で話 されたのかも?
• SREにおけるタスク管理とかチーム活動みたいなそういった部分について あんまり見れなかったのがちょっと残念だった • 働き方的なところをもう少し知りたかった • SREはいかに低コストで安全にやっていくのか?というところであまり実 験じみたことをやる人たちがいないのかもしれない?結果として、[基本X 独立]->[基本X横断]->[高度X横断]というパスがよいということか? • 世界のどこかで[高度X独立]をやっているとおもうんですが、めったにいないのかも しれない 19