Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
これから始めるSRE
Search
M.Yamamoto
October 31, 2024
Technology
0
39
これから始めるSRE
M.Yamamoto
October 31, 2024
Tweet
Share
More Decks by M.Yamamoto
See All by M.Yamamoto
README STUDIOサービス紹介資料
yamamoto99
0
6
GitHub SNS Profile Cardサービス紹介資料
yamamoto99
0
7
Es-Writerサービス紹介資料
yamamoto99
0
11
Other Decks in Technology
See All in Technology
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
230
CDCL による厳密解法を採用した MILP ソルバー
imai448
3
340
Mastering Quickfix
daisuzu
1
360
OCI Vault 概要
oracle4engineer
PRO
0
9.8k
アジャイルでの品質の進化 Agile in Motion vol.1/20241118 Hiroyuki Sato
shift_evolve
0
200
CysharpのOSS群から見るModern C#の現在地
neuecc
2
3.9k
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
2
3.2k
なぜ今 AI Agent なのか _近藤憲児
kenjikondobai
4
1.5k
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
3
670
オープンソースAIとは何か? --「オープンソースAIの定義 v1.0」詳細解説
shujisado
12
1.6k
iOSチームとAndroidチームでブランチ運用が違ったので整理してます
sansantech
PRO
0
170
rootlessコンテナのすゝめ - 研究室サーバーでもできる安全なコンテナ管理
kitsuya0828
3
400
Featured
See All Featured
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.8k
Fireside Chat
paigeccino
34
3k
What's in a price? How to price your products and services
michaelherold
243
12k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
GraphQLとの向き合い方2022年版
quramy
43
13k
Into the Great Unknown - MozCon
thekraken
33
1.5k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.8k
Designing Experiences People Love
moore
138
23k
Designing on Purpose - Digital PM Summit 2013
jponch
115
7k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
506
140k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Raft: Consensus for Rubyists
vanstee
136
6.6k
Transcript
z これから始めるSRE GitHub: @yamamoto99 X: @evdMPDGElQtCL6o Masato Yamamoto 2024.10.31
自己紹介 Masato Yamamoto • 大学3年生 • バックエンド&SRE • 普段はGo(Echo)書いてます •
趣味は野球観戦 @yamamoto99 @evdMPDGElQtCL6o
今日話す内容 • SREとは? • ユーザーの立場から考えよう • SLIとSLO • リスクを定量化する •
UJとCUJ • 次のステップ
SREとは? SREとは、組織がシステム、サービス、製品において適切なレベルの 信頼性を持続的に達成できるよう支援することを目的とした工学分野 Niall Richard Murphy, Betsy Beyer, Chris Jones,
Jennifer Petoff, SREサイトリライアビリティエンジニアリング(2017)O’Reilly Japan
似たようなもの以前からありましたよね?
DevOpsとの違い プロダクト 管理 開発 テスト・QA リリース 運用 DevOpsは左から右へ SREは右から左へ DevOpsは製品をデリバリーするためには何が必要か考える
SREは信頼できる本番環境を構築するためには何が必要か考える することは同じかもしれないが、理由には違いが生まれる 開発プロセス
ユーザーの立場から考えよう 開発者にとって20日の障害は、致し方ない案件 しかしユーザーにとってはどちらも同じ障害に見える 信頼性とは、ユーザーがサービスを安心して使えることである 仮定:あなたが100万人のユーザーを持つ開発者 • 10月10日 バージョンアップデートによる不具合で障害が発生 • 10月20日
AWSの不具合により障害が発生
問題 どのようにすればユーザーの気持ちを継続的に把握できるのか?
SLIとSLO • SLI(サービスレベル指標) ✓ リクエストのレイテンシなど、パフォーマンスの計測 ✓ サービスの利用不可時間、処理成功率などの指標を用いて可用性を計測 • SLO(サービスレベル目標) ✓
SLIで計測されるパフォーマンスや可用性の目標値や目標範囲 ✓ ユーザーが製品に満足しているかを定量的に測定する ✓ SLOは現実的な範囲で設定する
リスクを定量化する • エラーバジェット ✓ SLO内で許容されるエラーの割合 ✓ ビジネスで許容できるエラーの量を定義 • バーンレート ✓
エラーバジェットがすべて消費される速度 ✓ 測定することでサービスのSLO違反までの時間を判断できる
目指す場所それは ユーザーがサービスを信頼してくれること
UJとCUJ ユーザーが製品に満足しているかを定量的に測定するためには、 ユーザーがサービスを通じてどのような体験をしているかが重要 • UJ(ユーザージャーニー) ✓ ユーザーがサービスを体験する全体の過程 • CUJ(クリティカルユーザージャーニー) ✓
実装されていないとサービスとして成り立たない機能 ✓ サービスの質やパフォーマンスの改善点を特定する際の基準となることが多い
ケーススタディ 目標(ゴール) 達成するためのタスク 顧客にとって重要なこと 検索して商品を見つける 検索ワードを入力する 商品を選択して詳細を見る 使いたい時に使えること 条件通りの商品が表示されること 素早く結果が表示されること
カートに追加する 個数を選択してカートへ追加 指定の個数でカートに追加されること 素早く結果が表示されること 決済を行う 配送先の指定 支払い情報の入力 決済処理が完了すること 商品が届くこと 仮定 : ECサイトのCUJ
次のステップ • 実際に運用を初めてみる ✓ 学生はData dogやNew Relicが無料で利用可能 ✓ もちろんOSSでも可 •
SREは最初から完璧を目指す物ではない、継続的に見直し続けるもの • まずは小さなところから初めてみる
最後に 引用: O’Reilly Japan, https://www.oreilly.co.jp/books/9784814400904/ 引用: O’Reilly Japan, https://www.oreilly.co.jp/books/9784873117911/ •
本日の内容はSREのほんの一部です • 今回特に触れたのは下記の本