Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

us-east-1 の障害が 起きると なぜ ソワソワするのか

us-east-1 の障害が 起きると なぜ ソワソワするのか

Avatar for Kazuki Miura

Kazuki Miura PRO

November 21, 2025
Tweet

More Decks by Kazuki Miura

Other Decks in Technology

Transcript

  1. 189 cm → MIURA KAZKI (39) heptagon inc. Favorite: AWS

    MediaServices VPC の外側のサービス AWS Samurai  AWS Community Hero   AWS Ambassador    AWS Top Engineer Cloud Architect Sapporo 2 趣味: サウナ・ラジオ・音楽 前職:HTB
  2. Design For Failure 障害発生は予測不可能であり、また不可避です。AWS ではインフラの障害に対し 要因分析および発生率の低減に努めておりますが、障害の発生を完全に防ぐこと は困難です。 このため AWS では「Design

    For Failure 」( 故障を前提とした設計) を推奨してい ます。また、監視サービスやリソースの提供、ベストプラクティスのご案内等を 行っています。 Well-Architected Framework 信頼性の柱 https://aws.amazon.com/jp/premiumsupport/tech-support-guidelines/
  3. A. A. ! us-east-1 障害時、ap-northeast-1 のデータプレーンは基本的に 影響を受けず、既存のEC2 やRDS などは正常動作します。 しかし、IAM

    やRoute53 などグローバルサービスのコン トロールプレーンがus-east-1 に依存しているため、新 規リソースの作成や設定変更が困難になる可能性があ ります。つまり「既存サービスは動くが、新規構築や 変更ができない」状況になりやすいです。 (193 文字) Claude Opus 4.1 の答え
  4. A. A. us-east-1 での障害発生時、ap-northeast-1 への影響は主にコントロールプレー ンの依存関係によって決まります。 データプレーン(実際のサービス処理)は各リージョンで独立してい るため、ap-northeast-1 で稼働中のアプリケーションやサービスは通常 通り動作し続けます。しかし、コントロールプレーン(設定変更やリ

    ソース管理)の多くがus-east-1 に集中しているため、Route 53 、 CloudFront 、IAM 、ACM などのグローバルサービスで新規作成や設定変 更ができなくなる可能性があります。既存リソースの運用は継続され ますが、障害対応時の設定変更が制限される点に注意が必要です。 (302 文字) Amazon Q の答え
  5. A. A. Appendix B - Edge network global service guidance

    - AWS Fault Isolation Boundaries Troubleshooting IVS Low-Latency Streaming - Amazon IVS Control planes and data planes - Advanced Multi-AZ Resilience Patterns Global services - AWS Fault Isolation Boundaries How HashiCorp made cross-Region switchover seamless with Amazon Application Recovery Controller | AWS Architecture Blog Amazon Q の答え 続き
  6. Container Services コントロールプレーン Amazon EKS Amazon ECS AWS Fargate Amazon

    EC2 変更操作を加える Create Update Delete List などの操作 データプレーン コントロールプレーンは データプレーンに
  7. Tokyo Region Availability Zone Availability Zone Availability Zone Regional Control

    Plane AZ1 Control Plane AZ2 Control Plane AZ3 Control Plane AZ1 Data Plane AZ2 Data Plane AZ3 Data Plane 他のサービスも基本これ Regional Data Plane
  8. Zonal services Amazon RDS Amazon EC2 Amazon EBS Control Plane

    Data Plane リージョン AZ コントロールプレーンとデータプレーンの関係性での分類
  9. Zonal services Regional services Amazon RDS Amazon EC2 Amazon EBS

    Amazon S3 Amazon SQS Control Plane Data Plane Control Plane Data Plane リージョン AZ リージョン リージョン コントロールプレーンとデータプレーンの関係性での分類 一部例外
  10. Zonal services Regional services Global services Amazon RDS Amazon EC2

    Amazon EBS Amazon S3 Amazon SQS DynamoDB Amazon Route 53 AWS IAM CloudFront Control Plane Data Plane Control Plane Data Plane Control Plane Data Plane リージョン AZ リージョン リージョン パーティションに1つ Global コントロールプレーンとデータプレーンの関係性での分類 一部例外
  11. Control Plane Data Plane API で見てみると Amazon S3 CreateBucket PutBucketPolicy

    GetObject PutObject CreateLoadBalancer CreateTargetGroup itself CreateHostZone UpdateResourceRecordSet DNS resolusion health check CreateRole CreateManagePolicy AuthN(Authentication) AuthZ(Authorization) Elastic Load Balancing Amazon Route 53 AWS IAM
  12. Partitions Oregon Region N. Virginia Region Tokyo Region China (Beijing)

    China (Ningxia) US-EAST US-WEST Commercial Partition China Partition GovCloud Partition London Region ... aws aws-cn aws-us-gov
  13. Partitions Oregon Region N. Virginia Region Tokyo Region China (Beijing)

    China (Ningxia) US-EAST US-WEST Commercial Partition China Partition GovCloud Partition London Region ... European Sovereign Cloud German (Brandenburg) 2025 年末までに 開設予定らしい? GDPR 準拠のため https://www.youtube.com/watch?v=5M8SfFfGF-o aws aws-cn aws-us-gov ソブリン( 国家・政府)
  14. Tokyo Region Regional Data Plane Commercial Partition Availability Zone Availability

    Zone Availability Zone Regional Control Plane AZ1 Control Plane AZ2 Control Plane AZ3 Control Plane AZ1 Data Plane AZ1 Data Plane AZ1 Data Plane N.Virginia US-EAST-1 Region Oregon Region London Region Regional Data Plane Regional Data Plane
  15. Tokyo Region Regional Data Plane Commercial Partition Availability Zone Availability

    Zone Availability Zone Regional Control Plane AZ1 Control Plane AZ2 Control Plane AZ3 Control Plane AZ1 Data Plane AZ1 Data Plane AZ1 Data Plane N.Virginia US-EAST-1 Region Oregon Region London Region Regional Data Plane Regional Data Plane Partitional Control Plane
  16. Tokyo Region Regional Data Plane Commercial Partition Availability Zone Availability

    Zone Availability Zone Regional Control Plane AZ1 Control Plane AZ2 Control Plane AZ3 Control Plane AZ1 Data Plane AZ1 Data Plane AZ1 Data Plane N.Virginia US-EAST-1 Region Partitional Control Plane Oregon Region London Region Regional Data Plane Regional Data Plane
  17. Tokyo Region Regional Data Plane Commercial Partition N.Virginia US-EAST-1 Region

    Partitional Control Plane Oregon Region London Region Regional Data Plane Regional Data Plane データプレーンは各リージョンにあるが、 コントロールプレーンがパーティションに1つしかないサービスが存在している
  18. Zonal services Regional services Global services Amazon RDS Amazon EC2

    Amazon EBS Amazon S3 Amazon SQS DynamoDB Amazon Route 53 AWS IAM CloudFront Control Plane Data Plane Control Plane Data Plane Control Plane Data Plane リージョン AZ リージョン リージョン パーティションに1つ Global コントロールプレーンとデータプレーンの関係性での分類
  19. BP04 復旧中はコントロールプレーンではなく データプレーンを利用する Amazon Route 53 www.example.com → us-east-1.example.com Region

    Region User ChangeResourceRecordSet Amazon Route 53 Region Region Health check: us-east-1.example.com Health check: us-west-2.example.com コントロールプレーンの操作 データプレーンの操作
  20. BP04 復旧中はコントロールプレーンではなく データプレーンを利用する Amazon Route 53 www.example.com → us-east-1.example.com Region

    Region User ChangeResourceRecordSet Amazon Route 53 Region Region Health check: us-east-1.example.com Health check: us-west-2.example.com コントロールプレーンの操作 データプレーンの操作
  21. PutBucketCors DeleteBucketCors PutAccelerateConfiguration PutBucketRequestPayment PutBucketObjectLockConfiguration PutBucketTagging DeleteBucketTagging PutBucketReplication DeleteBucketReplication PutBucketEncryption

    DeleteBucketEncryption PutBucketLifecycle S3 のコントロールプレーンで us-east-1 に依存しているもの マルチリージョンアクセスポイントはus-west-2 CreateBucket DeleteBucket バケット名はグローバル( パーティション) でユニークである必要がある DeleteBucketLifecycle PutBucketNotification PutBucketLogging DeleteBucketLogging PutBucketVersioning PutBucketPolicy DeleteBucketPolicy PutBucketOwnershipControls DeleteBucketOwnershipControls PutBucketAcl PutBucketPublicAccessBlock DeleteBucketPublicAccessBlock Amazon S3 ぜんぜんSimple じゃない
  22. AWS re:Invent 2022 - Building resilient multi-site workloads using AWS

    global services (SUP401) https://youtu.be/62ZQHTruBnk AWS re:Invent 2024 - Mastering resilience at every layer of the cake (ARC327) https://youtu.be/kWpGMnkBhMI Resilience in AWS Identity and Access Management - AWS Identity and Access Management https://docs.aws.amazon.com/IAM/latest/UserGuide/disaster-recovery-resiliency.html コントロールプレーンとデータプレーンの概念から考えるAWS CLI でのS3 コマンドの分類方法 - サーバーワークスエンジニアブログ https://blog.serverworks.co.jp/2023/03/15/203201 REL11-BP04 復旧中はコントロールプレーンではなくデータプレーンを利用する - AWS Well-Architected フレームワーク https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/framework/rel_withstand_component_failures_avoid_control_plane.html グローバルサービス - AWS 障害分離境界 https://docs.aws.amazon.com/ja_jp/whitepapers/latest/aws-fault-isolation-boundaries/global-services.html AWS Support endpoints and quotas - AWS General Reference https://docs.aws.amazon.com/general/latest/gr/awssupport.html AWS 障害分離境界 - AWS ホワイトペーパー https://docs.aws.amazon.com/ja_jp/whitepapers/latest/aws-fault-isolation-boundaries/aws-fault-isolation-boundaries.pdf#control- planes-and-data-planes 参考資料