Slide 1

Slide 1 text

SREでなくともSRE NEXTの知見を現場に活かす方法 Road to SRE NEXT@名古屋 一体いつからSRE NEXTが SREだけのカンファレンスだと錯覚していた? Money Forward, Inc - Platform and Reliability Engineering本部 VTRyo

Slide 2

Slide 2 text

VTRyo 2018年くらいからSREしています SRE NEXT 2022 ONLINE 一人から始めるプロダクト SRE Developers Boost 2023 自分だけのだけの誰も想像 できないキャリアの育て方 ベストスピーカー賞 SRE Kaigi 2025 一人から始めたSREチーム 3年間の歩み SRE NEXT 2025 (7/11) 2

Slide 3

Slide 3 text

人生で名古屋に降りたのは3回目! 2013年 -> ナゴヤドーム(中日戦) 2024年 -> ナゴヤドーム(BUMP OF CHICKEN ライブ) 2025年 -> マネーフォワード名古屋 Road to SRE NEXT@名古屋 presentation by VTRyo 3

Slide 4

Slide 4 text

名古屋で食べたことのある名物! 誰かオススメおしえてください これまでの2回: 駅ホームのきしめんのみ!! ※ 住よしは美味しい Road to SRE NEXT@名古屋 presentation by VTRyo 4

Slide 5

Slide 5 text

今日の本題 SRE NEXTはSREだけの カンファレンスにあらず! Road to SRE NEXT@名古屋 presentation by VTRyo 5

Slide 6

Slide 6 text

SRE専門用語のむずかしさ バズワードによる互いの期待値のズレ 信頼性, SLI, SLO, CI/CD, Incident management, スケーラビリティなど なんとなくインフラに関する話が多そう、という印象 結果、自分にはあまり関係がないかも?と思われる 自社のチームから「SREが何をしているのかわからない」という意見…… Road to SRE NEXT@名古屋 presentation by VTRyo 6

Slide 7

Slide 7 text

そもそもSREとは何だったか? SREは対象の信頼性を制御・向上しようと あらゆることに取り組む人 Road to SRE NEXT@名古屋 presentation by VTRyo 7

Slide 8

Slide 8 text

信頼性が高いとは? ユーザが 「いつどんなときも安心して自分の目的を 達成できる」 と思えている状態 Road to SRE NEXT@名古屋 presentation by VTRyo 8

Slide 9

Slide 9 text

高い信頼性の例 コンピューターがインターネットに接続されているかを確認する Google Public DNSへの信頼 ping 8.8.8.8 基本的にいつでも使えて、その目的(接続テスト)が果たせる(正しく機能する) と考えられる Road to SRE NEXT@名古屋 presentation by VTRyo 9

Slide 10

Slide 10 text

最近のSREって何をされている方なの? 超絶多様化してしまったのである!! Road to SRE NEXT@名古屋 presentation by VTRyo 10

Slide 11

Slide 11 text

今回の発表をいくつかにカテゴライズしてみましょう おそらくもっとも多いのは現場課題解決 ● 現場の課題解決の話: 障害対応、コストカットなど現場に関するもの ● 実践的な技術の話: パフォーマンス、スケールアウトなど技術そのもの ● 組織の話: キャリア、組織構成など人に関するもの Road to SRE NEXT@名古屋 presentation by VTRyo 11

Slide 12

Slide 12 text

SRE NEXTの範囲がシステムやサービス以外にも派生 SREがこれらに関心を持つのは 「そのアプローチが最終的に信頼性の制御 につながる」から Road to SRE NEXT@名古屋 presentation by VTRyo 12

Slide 13

Slide 13 text

SRE NEXTから学びを得るために 信頼性を制御するために、SREの多くは「観察」から始める OODAループ: 観察 -> 判断 -> 行動 -> 観察 この法則を知っていると、SREがどんなアプローチで話を進めるのか理解できる 仮に「なんでこの話になったんだろう」と迷子になったとき、OODAループのど の辺に当てはまるのかを考えるだけでも違う 監視系 -> 状況の観察がしたい。これからどうすべきかを知りたい エラーバジェット -> 判断の高速化、障害未然防止、具体的な行動を促す CI/CD, スケールアウト -> 実際の行動(ただし自動) 。安定性の向上や高速リ リース 組織系の話 -> 信頼性の対象をシステムではなく人に。SREの考えを応用した事例 Road to SRE NEXT@名古屋 presentation by VTRyo 13

Slide 14

Slide 14 text

発表は「奥に隠された目的」を意識して聞いてみる 技術系よりも、組織やプラクティスそのものに関する発表は真似だけしようとす ると難しい 専門用語が邪魔をしがち 例「エラーバジェットポリシー運用までの取り組み」: エラーバジェットポリシー の本質は「重大な問題が起きた時にやるべきことを決めておく」である 観察したあとの判断・行動がセットになったプラクティス この目的は 「意思決定を最小限にすること」「サービスをなるべく速く安定 させること」 Road to SRE NEXT@名古屋 presentation by VTRyo 14

Slide 15

Slide 15 text

たとえばVTRyoの発表 60以上のプロダクトを持つ組織における開発者体験向上への取り組み -チームAPIとBackstageで構築する組織の可視化基盤- プロダクトの数が多すぎるゆえの認知負荷課題解決の一歩 「意思決定を最小限にすること」 「情報整理による開発者の負担軽減」など 組織がスケールし始めたなと感じている開発者、マネージャーといった 同じ課題を持つ人にオススメ。SREとは限らない Road to SRE NEXT@名古屋 presentation by VTRyo 15

Slide 16

Slide 16 text

たとえば信頼性の高い組織の例 高信頼性組織(HRO)の特徴 航空管制システム、原子力発電所、送電所、石油化学プラント、救急医療センター ① 失敗に注目する -> 失敗を教訓に ② 解釈の単純化を嫌がる -> 多様な解釈を取り入れるメンバーを歓迎 ③ オペレーションに敏感になる -> 不測の事態に常に気を配れる状態 ④ 回復に全力を注ぐ -> 何をやるべきか明確。自律的に行動可能 ⑤ 専門知識を尊重する -> もっとも適切な人材に権限を委譲 引用元:「高信頼性組織」という言葉をご存知ですか。 https://www.ginsen-risk.com/narage/newsletter/SI20090721.pdf Road to SRE NEXT@名古屋 presentation by VTRyo 16

Slide 17

Slide 17 text

私たちは知らずにSREしている時がある 「あれ、これってSREじゃないか?」と思わなくても、もはや良い あなたが責任を持っていることに対して徹底的に考え抜いたとき、自然と行動と して生まれるのかもしれない Road to SRE NEXT@名古屋 presentation by VTRyo 17

Slide 18

Slide 18 text

SREプラクティスは…… ノウハウの高速道路! Road to SRE NEXT@名古屋 presentation by VTRyo 18

Slide 19

Slide 19 text

SRE NEXTへ行こう いざ集合知へ! オンライン配信もあるぞ! Road to SRE NEXT@名古屋 presentation by VTRyo 19

Slide 20

Slide 20 text

一体いつからSRE NEXTが SREだけのカンファレンスだと錯覚していた? 完 Road to SRE NEXT@名古屋 presentation by VTRyo 20