Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
これから始めるSRE
Search
M.Yamamoto
October 31, 2024
Technology
0
94
これから始めるSRE
M.Yamamoto
October 31, 2024
Tweet
Share
More Decks by M.Yamamoto
See All by M.Yamamoto
README STUDIOサービス紹介資料
yamamoto99
0
26
GitHub SNS Profile Cardサービス紹介資料
yamamoto99
0
26
Es-Writerサービス紹介資料
yamamoto99
0
15
Other Decks in Technology
See All in Technology
Agile Leadership Summit Keynote 2026
m_seki
1
650
プロポーザルに込める段取り八分
shoheimitani
1
520
Oracle AI Database移行・アップグレード勉強会 - RAT活用編
oracle4engineer
PRO
0
100
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
15
93k
Red Hat OpenStack Services on OpenShift
tamemiya
0
120
OpenShiftでllm-dを動かそう!
jpishikawa
0
130
プロダクト成長を支える開発基盤とスケールに伴う課題
yuu26
4
1.4k
We Built for Predictability; The Workloads Didn’t Care
stahnma
0
140
セキュリティについて学ぶ会 / 2026 01 25 Takamatsu WordPress Meetup
rocketmartue
1
310
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
320
Context Engineeringが企業で不可欠になる理由
hirosatogamo
PRO
3
620
Embedded SREの終わりを設計する 「なんとなく」から計画的な自立支援へ
sansantech
PRO
3
2.5k
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Visualization
eitanlees
150
17k
Unsuck your backbone
ammeep
671
58k
4 Signs Your Business is Dying
shpigford
187
22k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
37k
How STYLIGHT went responsive
nonsquared
100
6k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
190
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.1k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
Utilizing Notion as your number one productivity tool
mfonobong
3
220
Transcript
z これから始めるSRE GitHub: @yamamoto99 X: @evdMPDGElQtCL6o Masato Yamamoto 2024.10.31
自己紹介 Masato Yamamoto • 大学3年生 • バックエンド&SRE • 普段はGo(Echo)書いてます •
趣味は野球観戦 @yamamoto99 @evdMPDGElQtCL6o
今日話す内容 • SREとは? • ユーザーの立場から考えよう • SLIとSLO • リスクを定量化する •
UJとCUJ • 次のステップ
SREとは? SREとは、組織がシステム、サービス、製品において適切なレベルの 信頼性を持続的に達成できるよう支援することを目的とした工学分野 Niall Richard Murphy, Betsy Beyer, Chris Jones,
Jennifer Petoff, SREサイトリライアビリティエンジニアリング(2017)O’Reilly Japan
似たようなもの以前からありましたよね?
DevOpsとの違い プロダクト 管理 開発 テスト・QA リリース 運用 DevOpsは左から右へ SREは右から左へ DevOpsは製品をデリバリーするためには何が必要か考える
SREは信頼できる本番環境を構築するためには何が必要か考える することは同じかもしれないが、理由には違いが生まれる 開発プロセス
ユーザーの立場から考えよう 開発者にとって20日の障害は、致し方ない案件 しかしユーザーにとってはどちらも同じ障害に見える 信頼性とは、ユーザーがサービスを安心して使えることである 仮定:あなたが100万人のユーザーを持つ開発者 • 10月10日 バージョンアップデートによる不具合で障害が発生 • 10月20日
AWSの不具合により障害が発生
問題 どのようにすればユーザーの気持ちを継続的に把握できるのか?
SLIとSLO • SLI(サービスレベル指標) ✓ リクエストのレイテンシなど、パフォーマンスの計測 ✓ サービスの利用不可時間、処理成功率などの指標を用いて可用性を計測 • SLO(サービスレベル目標) ✓
SLIで計測されるパフォーマンスや可用性の目標値や目標範囲 ✓ ユーザーが製品に満足しているかを定量的に測定する ✓ SLOは現実的な範囲で設定する
リスクを定量化する • エラーバジェット ✓ SLO内で許容されるエラーの割合 ✓ ビジネスで許容できるエラーの量を定義 • バーンレート ✓
エラーバジェットがすべて消費される速度 ✓ 測定することでサービスのSLO違反までの時間を判断できる
目指す場所それは ユーザーがサービスを信頼してくれること
UJとCUJ ユーザーが製品に満足しているかを定量的に測定するためには、 ユーザーがサービスを通じてどのような体験をしているかが重要 • UJ(ユーザージャーニー) ✓ ユーザーがサービスを体験する全体の過程 • CUJ(クリティカルユーザージャーニー) ✓
実装されていないとサービスとして成り立たない機能 ✓ サービスの質やパフォーマンスの改善点を特定する際の基準となることが多い
ケーススタディ 目標(ゴール) 達成するためのタスク 顧客にとって重要なこと 検索して商品を見つける 検索ワードを入力する 商品を選択して詳細を見る 使いたい時に使えること 条件通りの商品が表示されること 素早く結果が表示されること
カートに追加する 個数を選択してカートへ追加 指定の個数でカートに追加されること 素早く結果が表示されること 決済を行う 配送先の指定 支払い情報の入力 決済処理が完了すること 商品が届くこと 仮定 : ECサイトのCUJ
次のステップ • 実際に運用を初めてみる ✓ 学生はData dogやNew Relicが無料で利用可能 ✓ もちろんOSSでも可 •
SREは最初から完璧を目指す物ではない、継続的に見直し続けるもの • まずは小さなところから初めてみる
最後に 引用: O’Reilly Japan, https://www.oreilly.co.jp/books/9784814400904/ 引用: O’Reilly Japan, https://www.oreilly.co.jp/books/9784873117911/ •
本日の内容はSREのほんの一部です • 今回特に触れたのは下記の本