Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Summit後の打ち上げから考える「分散システムにおける耐障害性のある設計」
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
ShigeruOda
May 27, 2023
Technology
1
170
Summit後の打ち上げから考える「分散システムにおける耐障害性のある設計」
JAWS-UG初心者支部#56 Systems Manager 入門ハンズオン
https://jawsug-bgnr.connpass.com/event/283554/
でのLT
ShigeruOda
May 27, 2023
Tweet
Share
More Decks by ShigeruOda
See All by ShigeruOda
JAWS-UG クラウド女子会×初心者支部 コラボ会 ~子連れ参加ウェルカム勉強会!
shigeruoda
0
76
AWS re:Invent 2025 Apache Iceberg Recap
shigeruoda
1
75
Amazon Athena で JSON・Parquet・Iceberg のデータを検索し、性能を比較してみた
shigeruoda
1
480
Amazon S3標準/ S3 Tables/S3 Express One Zoneを使ったログ分析
shigeruoda
6
910
CFP選定とタイムテーブル決めについて
shigeruoda
0
160
今年前半のAWSアップデートを振り返り
shigeruoda
0
140
#31 JAWS-UG主催 週刊AWSキャッチアップ (2024/5/6週)
shigeruoda
0
190
#30 JAWS-UG主催 週刊AWSキャッチアップ(2024/4/29週)
shigeruoda
0
160
#28 JAWS-UG主催 週刊AWSキャッチアップ(2024/4/15週)
shigeruoda
0
190
Other Decks in Technology
See All in Technology
JAWS DAYS 2026 ExaWizards_20260307
exawizards
0
430
us-east-1 に障害が起きた時に、 ap-northeast-1 にどんな影響があるか 説明できるようになろう!
miu_crescent
PRO
13
4.3k
20260311 技術SWG活動報告(デジタルアイデンティティ人材育成推進WG Ph2 活動報告会)
oidfj
0
350
ナレッジワークのご紹介(第88回情報処理学会 )
kworkdev
PRO
0
210
僕、S3 シンプルって名前だけど全然シンプルじゃありません よろしくお願いします
yama3133
1
220
SRE NEXT 2026 CfP レビュアーが語る聞きたくなるプロポーザルとは?
yutakawasaki0911
1
350
ガバメントクラウドにおけるAWSの長期継続割引について
takeda_h
2
200
チームのモメンタムに投資せよ! 不確実性と共存しながら勢いを生み出す3つの実践
kakehashi
PRO
1
110
楽しく学ぼう!コミュニティ入門 AWSと人が つむいできたストーリー
hiroramos4
PRO
1
200
JAWS Days 2026 楽しく学ぼう! 認証認可 入門/20260307-jaws-days-novice-lane-auth
opelab
11
2.3k
Keycloak を使った SSO で CockroachDB にログインする / CockroachDB SSO with Keycloak
kota2and3kan
0
120
AWS DevOps Agent vs SRE俺 / AWS DevOps Agent vs me, the SRE
sms_tech
3
830
Featured
See All Featured
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
150
Six Lessons from altMBA
skipperchong
29
4.2k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
120
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
130
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
170
The World Runs on Bad Software
bkeepers
PRO
72
12k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
140
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.4k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
390
Accessibility Awareness
sabderemane
0
81
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
340
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
Transcript
Summit後の打ち上げから考 える「分散システムにおける耐 障害性のある設計」 Shigeru Oda
Hello! Shigeru Oda AWS Community Hero AWS Samurai @OutputSeq 2
4月21日(金) 15:20-16:00(40分) 【AWS-27】 Everything fails, all the time: 分散システムにおける 耐障害性のある設計について
の内容を紹介するLTです。
セッション、Expo DeepRacer GameDay AWS Jam 打ち上げ
Summit後のグループ討論が楽しかった!!
Pub とあるPub
Pub グループがスケールする
Pub-A Pubが混んできたので、グループが移動 Pub-B
店舗は非効率だ、立ち飲みでスケールしよう (モノリスは非効率だ、マイクロサービスでスケールしよう)
グループ間の情報連携が出来ない可能性がある
システムでも同じNWがネックになる ホテル予約 ツアー予約 飛行機予約 ポイント 支払い
各サービスで障害の可能性もあり、考慮が必要 ホテル予約 ツアー予約 飛行機予約 ポイント 支払い
リトライ機能 ホテル予約 飛行機予約 ・サーバーエラー ・タイムアウト ・スロットリング 2s 2s 2s
Exponential backoff(指数関数的 後退) ホテル予約 飛行機予約 ・サーバーエラー ・タイムアウト ・スロットリング 2^0=1s 2^1=2s
2^2=4s 2^4=8s
NW障害は Exponential backoffでも軽減できない ホテル予約 飛行機予約 ホテル予約 ホテル予約 ホテル予約 ホテル予約 ホテル予約
ホテル予約 ホテル予約 ・サーバーエラー ・タイムアウト ・スロットリング … ・AWS障害 ・AZ障害
Exponential backoff(指数関数的 後退) + Jitter(ばらつき) ホテル予約 飛行機予約 ・サーバーエラー ・タイムアウト ・スロットリング
Min0 - Max1 Min0 - Max2 Min0 - Max4 Min0 - Max8
・Exponetial Backoff sleep = min(最大停止時間, 基準睡眠時間 * 2 ** 試行回数)
・Exponetial Backoff And Full Jitter sleep = random_between( 0,min(最大停止時間, 基準睡眠時間 * 2 ** 試行回数)) ・Exponetial Backoff And Equal Jitter tmp = min(最大停止時間, 基準睡眠時間 * 2 ** 試行回数) sleep = tmp / 2 + randam_between(0,temp / 2) Exponential backoff(指数関数的 後退) + Jitter(ばらつき)の種類
サーキトブレイカー(遮断機)の導入 ホテル予約 ツアー予約 飛行機予約 ポイント 支払い
通常時 ホテル予約 飛行機予約 DynamoDBにサービス名が登 録されているかチェック 登録なし
通常時 → 異常時 ホテル予約 飛行機予約 DynamoDBにサービス名が登 録されているかチェック 登録なし レコード登録 ・Service:飛行機予約
・Status:1 ・TTL:Sysdate + 10分 Exponetial Backoff And Full Jitter
Lambdaで定期チェック(死活監視) 飛行機予約 定期チェック(死活監視) レコード登録 ・Service:飛行機予約 ・Status:1 ・TTL:Sysdate + 10分
異常時 → 異常時 ・ホテル予約 ・飛行機予約 DynamoDBにサービス名が登録されて いるかチェック 登録あり ・Service:飛行機予約 ・Status:1
・TTL:Sysdate + 10分
異常時 →10分経過→ 正常時 ホテル予約 飛行機予約 DynamoDBにサービス名が登 録されているかチェック 登録なし
サーキットブレイカーを行うサービス
Polyglot Persitence (ポリグロット・パーシステンス) ホテル予約 ツアー予約 飛行機予約 ポイント 支払い Document DB
Relation DB Key-Value DB Graph DB Relation DB
Sagaパターン ホテル予約 飛行機予約 ポイント 支払い エラー発生 ホテル予約(取消) 飛行機予約(取消) ポイント(取消) 正常系
正常系 正常系 取消 取消 取消
Sageパターンの種類 オーケストレーション オーケストレーション 2.Error 1.OK 1.Rollback
Sageパターンの種類 コレオグラフィ メッセージ ブローカー 1.OK Publish 1.OK Subscribe 2.NG Publish 2.OK
Subscribe 1.RollBack Publish
私見: マイクロサービスでの耐障害性、取消処理には これらの考慮が必要と考えます。
私見: しかし、初期リリースからここまで必要? 最初から最高のUI/UXが必要なのか?
thank you