Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Resilience Hubの登場が騒がれないなんておかしい!? / Resilience ...
Search
TomoyaKitaura
December 13, 2021
Technology
0
230
Resilience Hubの登場が騒がれないなんておかしい!? / Resilience Hub is the best.
2021/12/13 Tech-in勉強会で発表した資料です。
TomoyaKitaura
December 13, 2021
Tweet
Share
More Decks by TomoyaKitaura
See All by TomoyaKitaura
これからの設計で変わること pre:invent2024アップデート速報 / pre:invent2024 network update
tomoyakitaura
1
160
セキュリティ活動をちょっとずつやる戦略を実行した気づき / Incremental Security Initiatives
tomoyakitaura
0
120
社内共通コンテナレジストリを設立して、開発者体験向上を狙ってみた /Establishing container registry to improve DX
tomoyakitaura
2
190
LTワークショップ3日目 / LT Workshop Day 3
tomoyakitaura
0
150
LTワークショップ2日目 / LT Workshop Day 2
tomoyakitaura
0
140
LTワークショップ(1日目) / LT workshop day 1
tomoyakitaura
1
160
これまでの監視とクラウド時代の監視 / Monitoring the Past and the Cloud
tomoyakitaura
1
250
エンタープライズにおけるSRE立ち上げとNew Relic選定に至った背景とは / SRE Startup and New Relic in the Enterprise
tomoyakitaura
2
760
AWSとNew Relicのデータ連携を超高速で実装した話 / The story of a super-fast implementation of data integration between AWS and New Relic
tomoyakitaura
0
1.5k
Other Decks in Technology
See All in Technology
DevinでAI AWSエンジニア製造計画 序章 〜CDKを添えて〜/devin-load-to-aws-engineer
tomoki10
0
120
Two Blades, One Journey: Engineering While Managing
ohbarye
4
2k
Pwned Labsのすゝめ
ken5scal
2
430
"TEAM"を導入したら最高のエンジニア"Team"を実現できた / Deploying "TEAM" and Building the Best Engineering "Team"
yuj1osm
1
160
Potential EM 制度を始めた理由、そして2年後にやめた理由 - EMConf JP 2025
hoyo
2
2.6k
役員・マネージャー・著者・エンジニアそれぞれの立場から見たAWS認定資格
nrinetcom
PRO
3
6k
データエンジニアリング領域におけるDuckDBのユースケース
chanyou0311
9
2.2k
Perlの生きのこり - エンジニアがこの先生きのこるためのカンファレンス2025
kfly8
2
270
システム・ML活用を広げるdbtのデータモデリング / Expanding System & ML Use with dbt Modeling
i125
1
320
AWS Well-Architected Frameworkで学ぶAmazon ECSのセキュリティ対策
umekou
2
140
ディスプレイ広告(Yahoo!広告・LINE広告)におけるバックエンド開発
lycorptech_jp
PRO
0
360
OSS構成管理ツールCMDBuildを使ったAWSリソース管理の自動化
satorufunai
0
640
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
430
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Statistics for Hackers
jakevdp
797
220k
RailsConf 2023
tenderlove
29
1k
Gamification - CAS2011
davidbonilla
80
5.2k
Music & Morning Musume
bryan
46
6.4k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.5k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
133
33k
Transcript
Resilience Hubの登場が 騒がれないなんておかしい!? ~ とあるSREsが考えたRPO RTOが計測された世界観と野望 ~ 株式会社 mediba Tomoya Kitaura
2021/12/13 Tech-in 1
自己紹介 Tomoya Kitaura @kitta0108 mediba inc. SRE Unit ▪勉強会運営 -
- JAWS-UG コンテナ支部 - JAWS-UG SRE支部 ▪好きなAWSのサービス - Amazon VPC 2
Resilience Hubとは? RPO、RTOなどの耐障害性を定義、追跡、管理を 支援するためのマネージドサービス。 RTO = 目標復旧時間 RPO = 目標復旧時点
3
SREの原則 https://cloud.google.com/architecture/framework/reliability/principles?hl=ja 信頼性は最優先の機能 4
サーバーに対する扱いの変化 その1 https://aws.amazon.com/jp/compliance/shared-responsibility-model/ 例えばAWS責任共有モデル 5
サーバーに対する扱いの変化 その2 https://blog.engineyard.com/pets-vs-cattle 例えばこんな言葉 6 ペットから家畜へ
会場の方への質問 7 サーバーは落ちるという前提で アプリケーションの開発・設計 あるいは考慮している
会場の方への質問 その2 8 - 障害発生時のアプリケーションの 振る舞いを理解している。 - 障害発生時のオートヒーリングによる 復旧時間を計測している。 -
障害発生時の復旧回復時点を理解している。 - 継続的に上記を計測し、改善する仕組みを 取りいれている。 ↑ 必要では??
Resilience Hub活用例 9
まとめ 10 - 信頼性は重要な機能 - 信頼性は重要な機能(大事なことなので) - 僕らは耐久性の管理が必要なのではないか - Resilience
HubはRTO,RPOの追跡管理に使える - FISとの機能連携によりいい感じの継続的計測が可能に。
さいごに 11 より高みを目指した開発を行うことの過程を みんなで楽しんでいきましょう!! ご静聴ありがとうございました!!