Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Resilience Hubの登場が騒がれないなんておかしい!? / Resilience ...
Search
TomoyaKitaura
December 13, 2021
Technology
0
240
Resilience Hubの登場が騒がれないなんておかしい!? / Resilience Hub is the best.
2021/12/13 Tech-in勉強会で発表した資料です。
TomoyaKitaura
December 13, 2021
Tweet
Share
More Decks by TomoyaKitaura
See All by TomoyaKitaura
New Relicの推せるところ・推せないところ / newrelic good and bad
tomoyakitaura
0
76
サービスレベルを管理してアジャイルを加速しよう!! / slm-accelerate-agility
tomoyakitaura
1
240
「頑張る」を「楽しむ」に変換する技術
tomoyakitaura
17
10k
これからの設計で変わること pre:invent2024アップデート速報 / pre:invent2024 network update
tomoyakitaura
1
220
セキュリティ活動をちょっとずつやる戦略を実行した気づき / Incremental Security Initiatives
tomoyakitaura
0
180
社内共通コンテナレジストリを設立して、開発者体験向上を狙ってみた /Establishing container registry to improve DX
tomoyakitaura
2
200
LTワークショップ3日目 / LT Workshop Day 3
tomoyakitaura
0
180
LTワークショップ2日目 / LT Workshop Day 2
tomoyakitaura
0
160
LTワークショップ(1日目) / LT workshop day 1
tomoyakitaura
1
190
Other Decks in Technology
See All in Technology
AWS CDK 開発を成功に導くトラブルシューティングガイド
wandora58
2
110
NewSQLや分散データベースを支えるRaftの仕組み - 仕組みを理解して知る得意不得意
hacomono
PRO
3
180
Model Mondays S2E04: AI Developer Experiences
nitya
0
190
United Airlines Customer Service– Call 1-833-341-3142 Now!
airhelp
0
170
スタートアップに選択肢を 〜生成AIを活用したセカンダリー事業への挑戦〜
nstock
0
250
VS CodeとGitHub Copilotで爆速開発!アップデートの波に乗るおさらい会 / Rapid Development with VS Code and GitHub Copilot: Catch the Latest Wave
yamachu
2
160
事業成長の裏側:エンジニア組織と開発生産性の進化 / 20250703 Rinto Ikenoue
shift_evolve
PRO
3
22k
Coinbase™®️ USA Contact Numbers: Complete 2025 Support Guide
officialcoinbasehelpcenter
0
440
インフラ寄りSREの生存戦略
sansantech
PRO
5
1.6k
ビギナーであり続ける/beginning
ikuodanaka
3
780
成長し続けるアプリのためのテストと設計の関係、そして意思決定の記録。
sansantech
PRO
0
130
開発生産性を測る前にやるべきこと - 組織改善の実践 / Before Measuring Dev Productivity
kaonavi
13
6k
Featured
See All Featured
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
48
2.9k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
46
9.6k
Intergalactic Javascript Robots from Outer Space
tanoku
271
27k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.4k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Transcript
Resilience Hubの登場が 騒がれないなんておかしい!? ~ とあるSREsが考えたRPO RTOが計測された世界観と野望 ~ 株式会社 mediba Tomoya Kitaura
2021/12/13 Tech-in 1
自己紹介 Tomoya Kitaura @kitta0108 mediba inc. SRE Unit ▪勉強会運営 -
- JAWS-UG コンテナ支部 - JAWS-UG SRE支部 ▪好きなAWSのサービス - Amazon VPC 2
Resilience Hubとは? RPO、RTOなどの耐障害性を定義、追跡、管理を 支援するためのマネージドサービス。 RTO = 目標復旧時間 RPO = 目標復旧時点
3
SREの原則 https://cloud.google.com/architecture/framework/reliability/principles?hl=ja 信頼性は最優先の機能 4
サーバーに対する扱いの変化 その1 https://aws.amazon.com/jp/compliance/shared-responsibility-model/ 例えばAWS責任共有モデル 5
サーバーに対する扱いの変化 その2 https://blog.engineyard.com/pets-vs-cattle 例えばこんな言葉 6 ペットから家畜へ
会場の方への質問 7 サーバーは落ちるという前提で アプリケーションの開発・設計 あるいは考慮している
会場の方への質問 その2 8 - 障害発生時のアプリケーションの 振る舞いを理解している。 - 障害発生時のオートヒーリングによる 復旧時間を計測している。 -
障害発生時の復旧回復時点を理解している。 - 継続的に上記を計測し、改善する仕組みを 取りいれている。 ↑ 必要では??
Resilience Hub活用例 9
まとめ 10 - 信頼性は重要な機能 - 信頼性は重要な機能(大事なことなので) - 僕らは耐久性の管理が必要なのではないか - Resilience
HubはRTO,RPOの追跡管理に使える - FISとの機能連携によりいい感じの継続的計測が可能に。
さいごに 11 より高みを目指した開発を行うことの過程を みんなで楽しんでいきましょう!! ご静聴ありがとうございました!!