Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ホントにあったAmazon_EC2のコワーイ話.pdf
Search
caad TakaraShinya
August 25, 2024
Technology
110
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ホントにあったAmazon_EC2のコワーイ話.pdf
caad TakaraShinya
August 25, 2024
More Decks by caad TakaraShinya
See All by caad TakaraShinya
S3に関する調査が必要になったときの 効率よく調査できるTips
takarashinya
0
49
生成AIと子どものお手伝い回数管理するWEBアプリ作ってみた
takarashinya
0
82
Next.js LearnのアプリでDB連携してる箇所をAPI化して、Swagger化してみた
takarashinya
0
320
システム開発におけるドキュメントをできるだけGithub Pagesに集約してみた話
takarashinya
0
3.9k
WordpressにAWS Copilot CLIを利用したら利用事例に掲載してもらえた話
takarashinya
2
400
Other Decks in Technology
See All in Technology
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
310
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
130
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
130
2026TECHFRESH畢業分享會 - Lightning Talk - 打造精準高效的 MCP 設計模式與測試實務
line_developers_tw
PRO
0
1.1k
【セミナー資料】Claude Code をセキュアに使うための考え方と設定の勘どころ / Claude Code Webinar 20260616
masahirokawahara
2
350
Bucharest Tech Week 2026 - Reinventing testing practices in the AI era
edeandrea
PRO
1
160
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
120
日本 Fintech 未来予測レポート 2027〜2028年(オリジナル版)
8maki
0
2.2k
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
140
作って終わりにしない タイミーのセマンティックレイヤー育成の現在地
chanyou0311
4
2.4k
Android の公式 Skill / Android skills
yanzm
0
150
現地で盛り上がった WWDC26 Keynote
zozotech
PRO
1
250
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
My Coaching Mixtape
mlcsv
0
150
Product Roadmaps are Hard
iamctodd
PRO
55
12k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
230
23k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
Ruling the World: When Life Gets Gamed
codingconduct
0
250
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.3k
What's in a price? How to price your products and services
michaelherold
247
13k
Utilizing Notion as your number one productivity tool
mfonobong
4
320
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
Are puppies a ranking factor?
jonoalderson
1
3.5k
Transcript
ホントにあった Amazon EC2のコワーイ話 Shima Tech Hub#5 by takarake preencoded.png
ホントにあった Amazon EC2のコワーイ話 話 Shima Tech Hub#5 by takarake preencoded.png
皆さんの業務でAmazon EC2は使われていますか? 本日は2019年のある日起こった、予想外の出来事についてお話します。 皆さんのご利用の環境でも発生する可能性はゼロではありません。 これを聞いて実はクラウドって怖いんだと思って帰ってくださいw
自己紹介 • 高良 真也 (XX) ※年齢、知りたい人は聞いてねw • 技術統括本部 マネージャー •
沖縄、ベトナムをまたいで仕事してます • (最近、無料でGCP認定GET )
Amazon EC2とは? クラウドコンピューティング Amazon EC2はAmazonのクラウドコン ピューティングサービスです。オンデマ ンドのコンピューティング能力を提供し 、ユーザーが必要に応じて柔軟に利用で きます。 仮想サーバー
EC2では仮想サーバーをクラウド上で作 成・管理できます。物理的なサーバーを 用意する必要がなく、簡単にスケーリン グできるのが特徴です。 高可用性 AWSのデータセンターには高度な冗長性 があり、サービスの可用性が高いのが魅 力です。障害に強いインフラを実現して います。 preencoded.png
Amazon EC2のオートスケーリング EC2の柔軟なリソース管理 EC2のオートスケーリング機能により、 アプリケーションの需要に合わせてリソ ースを自動的に拡張または縮小できます 需要に合わせたスケールアウト ピーク時のトラフィックにも柔軟に対応 できるよう、EC2のリソースを自動的に スケールアウトできます。
障害に強いインフラ AWSのデータセンターは高度な冗長性を 備えているため、サービスの可用性が高 く、障害に強いインフラを実現できます preencoded.png
コワーイ話の前に・・・ ✓ 2019年の出来事ですが、今は発生しないとは保証できません ✓ あるシステムのインフラ環境にAmazon EC2を利用 ✓ コスト最適化を目的にAutoScalingによる起動数調整していた ✓ 夜中に起動数減
、朝に起動数増 で運用中 preencoded.png
コワーイ話の前に・・・ では参ります preencoded.png
Amazon EC2のコワーイ話 1 突然のエラー スケールアウト不可でエラーが発生 2 3 4 preencoded.png
Amazon EC2のコワーイ話 1 突然のエラー スケールアウト不可でエラーが発生 2 アクセス障害への恐怖 平日営業開始前の発生のため、 稼働リソース不足起因の障害発生 の不安に襲われる
3 4 preencoded.png
Amazon EC2のコワーイ話 1 突然のエラー スケールアウト不可でエラーが発生 2 アクセス障害への恐怖 平日営業開始前の発生のため、 稼働リソース不足起因の障害発生 の不安に襲われる
3 原因は???????? ?????????????????? 4 preencoded.png
preencoded.png 2019年 3月 14日のAutoScaling実行結果ログ 翻訳 新しいEC2インスタンスを起動しています。 現在、リクエストされたアベイラビリティゾーン(ap-northeast-1c)に十分なm3.largeのキャパシティがありません。 システムは追加のキャパシティを提供するために作業を行っています。 現在、アベイラビリティゾーンを指定しないか、ap-northeast-1aを選択することでm3.largeのキャパシティを取得できます。EC2インスタ
preencoded.png エッ・・・・・・ってなりませんか????
preencoded.png ※再掲 2019年 3月 14日のAutoScaling実行結果ログ 翻訳 新しいEC2インスタンスを起動しています。 現在、リクエストされたアベイラビリティゾーン(ap-northeast-1c)に十分なm3.largeのキャパシティがありません。 システムは追加のキャパシティを提供するために作業を行っています。 現在、アベイラビリティゾーンを指定しないか、ap-northeast-1aを選択することでm3.largeのキャパシティを取得できます。EC2インスタ
Amazon EC2のコワーイ話 1 突然のエラー スケールアウト不可でエラーが発生 2 アクセス障害への恐怖 平日営業開始前の発生のため、 稼働リソース不足起因の障害発生 の不安に襲われる
3 キャパシティ不足の問題 原因は東京リージョンの 特定AZのキャパシティ不足 4 preencoded.png
Amazon EC2のコワーイ話 1 突然のエラー スケールアウト不可でエラーが発生 2 アクセス障害への恐怖 平日営業開始前の発生のため、 稼働リソース不足起因の障害発生 の不安に襲われる
3 キャパシティ不足の問題 原因は東京リージョンの 特定AZのキャパシティ不足 4 preencoded.png 早期対応できず キャパ不足のまま営業時間となり 、CPU負荷アラートが
その後の対応 冷静な分析 即、暫定対応 まずは落ち着いて状況を分析 と言いたいですが、アラートも届いてる ので、手動で別AZへのインスタンス起動とALB接続にて暫定対応 手動対応したサーバを維持しつつ、様子見 特定AZで早朝バッチ等でリソースを別のお客様に抑えられてる ような挙動を確認(〜10:00前後には自動的にエラー解消するため )
2019年 4月 1日に利用するタイプ変更し恒久対応完了 m3.large -> t2.large へ それでも2021年までは年に1度は同じエラーが発生するのを確認 preencoded.png
まとめ 学習の機会 AWSだって、インスタンスのキャパシテ ィは無限大じゃない 共有リソースをシェアして利用? AWSに確認したわけではないが、そんな 挙動でした 起動テンプレートで改善 複数のインスタンスタイプを選択可能なため、 こちらに変更可能だが、コンテナ化をトライ
preencoded.png
preencoded.png
ご静聴ありがとうございました preencoded.png