Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Summit後の打ち上げから考える「分散システムにおける耐障害性のある設計」
Search
ShigeruOda
May 27, 2023
Technology
1
160
Summit後の打ち上げから考える「分散システムにおける耐障害性のある設計」
JAWS-UG初心者支部#56 Systems Manager 入門ハンズオン
https://jawsug-bgnr.connpass.com/event/283554/
でのLT
ShigeruOda
May 27, 2023
Tweet
Share
More Decks by ShigeruOda
See All by ShigeruOda
Amazon S3標準/ S3 Tables/S3 Express One Zoneを使ったログ分析
shigeruoda
6
820
CFP選定とタイムテーブル決めについて
shigeruoda
0
94
今年前半のAWSアップデートを振り返り
shigeruoda
0
120
#31 JAWS-UG主催 週刊AWSキャッチアップ (2024/5/6週)
shigeruoda
0
160
#30 JAWS-UG主催 週刊AWSキャッチアップ(2024/4/29週)
shigeruoda
0
140
#28 JAWS-UG主催 週刊AWSキャッチアップ(2024/4/15週)
shigeruoda
0
160
#27 JAWS-UG主催 週刊AWSキャッチアップ(2024/4/8週)
shigeruoda
0
180
#26 JAWS-UG主催 週刊AWSキャッチアップ(2024/4/1週)
shigeruoda
0
150
#24 JAWS-UG主催 週刊AWSキャッチアップ(2024/03/18週)
shigeruoda
0
380
Other Decks in Technology
See All in Technology
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
3
5.5k
なぜAWSを活かしきれないのか?技術と組織への処方箋
nrinetcom
PRO
4
800
E2Eテスト設計_自動化のリアル___Playwrightでの実践とMCPの試み__AIによるテスト観点作成_.pdf
findy_eventslides
2
600
Uncle Bobの「プロフェッショナリズムへの期待」から学ぶプロの覚悟
nakasho
2
110
AIツールでどこまでデザインを忠実に実装できるのか
oikon48
6
3.3k
Performance Insights 廃止から Database Insights 利用へ/transition-from-performance-insights-to-database-insights
emiki
0
240
【Kaigi on Rails 事後勉強会LT】MeはどうしてGirlsに? 私とRubyを繋いだRail(s)
joyfrommasara
0
240
いまからでも遅くない!SSL/TLS証明書超入門(It's not too late to start! SSL/TLS Certificates: The Absolute Beginner's Guide)
norimuraz
0
200
プロポーザルのコツ ~ Kaigi on Rails 2025 初参加で3名の登壇を実現 ~
naro143
1
220
「れきちず」のこれまでとこれから - 誰にでもわかりやすい歴史地図を目指して / FOSS4G 2025 Japan
hjmkth
1
300
20201008_ファインディ_品質意識を育てる役目は人かAIか___2_.pdf
findy_eventslides
2
610
Reflections of AI: A Trilogy in Four Parts (GOTO; Copenhagen 2025)
ondfisk
0
110
Featured
See All Featured
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
189
55k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Rails Girls Zürich Keynote
gr2m
95
14k
Building an army of robots
kneath
306
46k
Context Engineering - Making Every Token Count
addyosmani
6
240
The Pragmatic Product Professional
lauravandoore
36
6.9k
Testing 201, or: Great Expectations
jmmastey
45
7.7k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.1k
Optimizing for Happiness
mojombo
379
70k
Typedesign – Prime Four
hannesfritz
42
2.8k
Building Better People: How to give real-time feedback that sticks.
wjessup
369
20k
Transcript
Summit後の打ち上げから考 える「分散システムにおける耐 障害性のある設計」 Shigeru Oda
Hello! Shigeru Oda AWS Community Hero AWS Samurai @OutputSeq 2
4月21日(金) 15:20-16:00(40分) 【AWS-27】 Everything fails, all the time: 分散システムにおける 耐障害性のある設計について
の内容を紹介するLTです。
セッション、Expo DeepRacer GameDay AWS Jam 打ち上げ
Summit後のグループ討論が楽しかった!!
Pub とあるPub
Pub グループがスケールする
Pub-A Pubが混んできたので、グループが移動 Pub-B
店舗は非効率だ、立ち飲みでスケールしよう (モノリスは非効率だ、マイクロサービスでスケールしよう)
グループ間の情報連携が出来ない可能性がある
システムでも同じNWがネックになる ホテル予約 ツアー予約 飛行機予約 ポイント 支払い
各サービスで障害の可能性もあり、考慮が必要 ホテル予約 ツアー予約 飛行機予約 ポイント 支払い
リトライ機能 ホテル予約 飛行機予約 ・サーバーエラー ・タイムアウト ・スロットリング 2s 2s 2s
Exponential backoff(指数関数的 後退) ホテル予約 飛行機予約 ・サーバーエラー ・タイムアウト ・スロットリング 2^0=1s 2^1=2s
2^2=4s 2^4=8s
NW障害は Exponential backoffでも軽減できない ホテル予約 飛行機予約 ホテル予約 ホテル予約 ホテル予約 ホテル予約 ホテル予約
ホテル予約 ホテル予約 ・サーバーエラー ・タイムアウト ・スロットリング … ・AWS障害 ・AZ障害
Exponential backoff(指数関数的 後退) + Jitter(ばらつき) ホテル予約 飛行機予約 ・サーバーエラー ・タイムアウト ・スロットリング
Min0 - Max1 Min0 - Max2 Min0 - Max4 Min0 - Max8
・Exponetial Backoff sleep = min(最大停止時間, 基準睡眠時間 * 2 ** 試行回数)
・Exponetial Backoff And Full Jitter sleep = random_between( 0,min(最大停止時間, 基準睡眠時間 * 2 ** 試行回数)) ・Exponetial Backoff And Equal Jitter tmp = min(最大停止時間, 基準睡眠時間 * 2 ** 試行回数) sleep = tmp / 2 + randam_between(0,temp / 2) Exponential backoff(指数関数的 後退) + Jitter(ばらつき)の種類
サーキトブレイカー(遮断機)の導入 ホテル予約 ツアー予約 飛行機予約 ポイント 支払い
通常時 ホテル予約 飛行機予約 DynamoDBにサービス名が登 録されているかチェック 登録なし
通常時 → 異常時 ホテル予約 飛行機予約 DynamoDBにサービス名が登 録されているかチェック 登録なし レコード登録 ・Service:飛行機予約
・Status:1 ・TTL:Sysdate + 10分 Exponetial Backoff And Full Jitter
Lambdaで定期チェック(死活監視) 飛行機予約 定期チェック(死活監視) レコード登録 ・Service:飛行機予約 ・Status:1 ・TTL:Sysdate + 10分
異常時 → 異常時 ・ホテル予約 ・飛行機予約 DynamoDBにサービス名が登録されて いるかチェック 登録あり ・Service:飛行機予約 ・Status:1
・TTL:Sysdate + 10分
異常時 →10分経過→ 正常時 ホテル予約 飛行機予約 DynamoDBにサービス名が登 録されているかチェック 登録なし
サーキットブレイカーを行うサービス
Polyglot Persitence (ポリグロット・パーシステンス) ホテル予約 ツアー予約 飛行機予約 ポイント 支払い Document DB
Relation DB Key-Value DB Graph DB Relation DB
Sagaパターン ホテル予約 飛行機予約 ポイント 支払い エラー発生 ホテル予約(取消) 飛行機予約(取消) ポイント(取消) 正常系
正常系 正常系 取消 取消 取消
Sageパターンの種類 オーケストレーション オーケストレーション 2.Error 1.OK 1.Rollback
Sageパターンの種類 コレオグラフィ メッセージ ブローカー 1.OK Publish 1.OK Subscribe 2.NG Publish 2.OK
Subscribe 1.RollBack Publish
私見: マイクロサービスでの耐障害性、取消処理には これらの考慮が必要と考えます。
私見: しかし、初期リリースからここまで必要? 最初から最高のUI/UXが必要なのか?
thank you