Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
クラウドの落とし穴:AWS Backupで発生した高額請求の衝撃とその教訓
Search
平木佳介
January 25, 2024
0
6k
クラウドの落とし穴:AWS Backupで発生した高額請求の衝撃とその教訓
平木佳介
January 25, 2024
Tweet
Share
More Decks by 平木佳介
See All by 平木佳介
踏み台の運用が変わる? VPC上で起動できるようになったCloudShellを語る
khiraki
1
3.8k
AWS re:Inforce 2024 re:Cap セミナー ~IAM Access Analyzerのアップデートを語ります~
khiraki
1
590
組織におけるAWSネットワーク集約王者決定戦
khiraki
1
490
速さの鍵を握る! Fastly で実現する CDN の力
khiraki
1
610
AIと一緒に音楽を作ろう ~作曲体験セッション~ | DevelopersIO 2023
khiraki
0
1.6k
Amazon Security Lake サービス概要
khiraki
0
4.8k
Featured
See All Featured
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
28
2k
BBQ
matthewcrist
85
9.3k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
16
2.1k
Bash Introduction
62gerente
608
210k
Faster Mobile Websites
deanohume
305
30k
Six Lessons from altMBA
skipperchong
27
3.5k
The Cult of Friendly URLs
andyhume
78
6k
Practical Orchestrator
shlominoach
186
10k
4 Signs Your Business is Dying
shpigford
180
21k
Git: the NoSQL Database
bkeepers
PRO
427
64k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
109
49k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
Transcript
AWS cafeteria #1 クラウドの落とし穴:AWS Backupで発生した高額請求の衝撃 とその教訓 クラスメソッド株式会社 AWS事業本部 | 平木
佳介 1
自己紹介 2 ~$ whoami 平木佳介 (Hiraki Keisuke) ~$ ~$ jobs
[2]+ 実行中 クラスメソッド(株)AWS事業本部コンサルティング部 ~$ ~$ groups ソリューションアーキテクト ~$ ~$ cat 平木佳介.conf | grep 趣味 趣味: 旅行/推し事 ~$ ~$ cat 平木佳介.conf | grep 好きなAWSサービス 好きなAWSサービス: AWS Security Hub
3 あなたは何かで 1位を取ったことはありますか?
4 ある年の瀬のこと 弊社Slackでは週次でとあるランキングが自動投稿される 圧倒的1位っ…!
5 ある年の瀬のこと 社内個人検証環境のAWS利用金額のランキングでした
6 ある年の瀬のこと 1ドル ≒ 142円18銭(2023年12月22日時点) 22,979.9ドル ≒ 3,267,282円
7 トピック 高額請求が発生した背景 01 02 04 03 AWSサポートとのやり取り 各フェーズにおける教訓 まとめ
8 トピック 高額請求が発生した背景 01 02 04 03 AWSサポートとのやり取り 各フェーズにおける教訓 まとめ
9 高額請求が発生した背景 2023年11月27日 (re:Invent2023期間) AWS Backup 新機能 自動復元テストが追加
10 高額請求が発生した背景 自動復元テスト: 復元可能な状態を自動かつ定期的に検証する機能
11 高額請求が発生した背景 AWS Backup 自動復元テスト https://dev.classmethod.jp/articles/aws-backup-automated-recovery-tests/
12 高額請求が発生した背景 12月某日下記設定で検証を開始 対象: EC2インスタンス1台(t2.micro) バックアップ取得タイミング: 1時間毎 復元テストタイミング: 1時間毎
13 高額請求が発生した背景 1時間毎にバックアップが取得され、 1時間毎に取得したバックアップの復元テストが発生するただそ れだけの想定だった… 1 2 3 4
14 ただし 特定の条件下だと 再帰的なループが発生する罠が
15 高額請求が発生した背景 復元テストで生成されたリソースを、 バックアッププランがバックアップを実施
16 高額請求が発生した背景 特定の条件とは 1 2 3 バックアッププランと復元テストプランの実行 時間帯が一致1 バックアッププランの対象に復元テストプラ ンで生成されるリソースが含まれる
バックアッププランで復元テストが生成する リソースのタグを除外していない
17 高額請求が発生した背景 再帰ループによって作成されたリソース EC2インスタンス: 12,750台 リカバリーポイント:10,356個
18 高額請求が発生した背景 RecoveryPointCreated API 推移 3日合計 10,356回 最大 457回/h
19 高額請求が発生した背景 RunInstances API 推移 3日合計 447,804回 最大 132,318回/h 約98%はエラーで失敗
20 高額請求が発生した背景 日次のAWS利用額の通知を実装していたが、 休日を挟んでいたこと、 指数関数的にリソースが急増したのが検証2日目だったこと が重なり気づいた頃には高額に…
21 トピック 高額請求が発生した背景 01 02 04 03 AWSサポートとのやり取り 各フェーズにおける教訓 まとめ
22 AWSサポートとのやり取り 高額請求に気づいた時にまずやったこと 1 2 3 バックアッププランで使用されるサービスロール AWSBackupDefaultServiceRole の権限はく奪1 バックアッププランと復元テストプランに関連する情報を
ひたすらスクリーンショット AWS CLIを使用し、大量生成されたリソースの一括削 除とプランの削除
23 AWSサポートとのやり取り セキュリティインシデントや その他意図しないインシデントによって 高額請求が発生した場合、 AWSサポートにてAWS利用料金の減免を相談できる場 合があります。 ※AWSの担当部署での判断となるため必ずではございません。
24 AWSサポートとのやり取り 上長へ報告後、 AWSサポートに問い合わせを行い、下記情報を連携。 ・問い合わせ背景 ・時系列 ・リソースを作成した環境 ・具体的な設定(リソースID、ARNも) ・現状分かっている状況
・推定される発生要因
25 AWSサポートとのやり取り AWSサポートから情報提供を求められたこと ・調整したい請求対象期間およびサービス名 ・再発防止のための予防策
26 AWSサポートとのやり取り AWSサポートとのやり取りを 年をまたぎ約1か月待った結果…
27 AWSサポートとのやり取り 無事、全額免除いただけました!! :感 :謝 !っ :感圧 :謝倒 !っ的
28 トピック 高額請求が発生した背景 01 02 04 03 AWSサポートとのやり取り 各フェーズにおける教訓 まとめ
29 各フェーズにおける教訓 教訓 1 2 3 平常時 高額請求発覚直後 原因対処完了後
30 各フェーズにおける教訓 平常時 コストの異常事態に気づくために コストのアラート通知(AWS Budgetsなど)や AWS Cost Anomaly
Detectionを利用する
31 各フェーズにおける教訓 AWS Budgets #とは 設定した予算に応じたアラートやレポートの生成など を行えるサービス
32 各フェーズにおける教訓 AWS Budgets https://dev.classmethod.jp/articles/aws-budgets-tutorial/
33 各フェーズにおける教訓 AWS Cost Anomaly Detection #とは 機械学習モデルを利用し、異常なAWSコストの発生 を検知するサービス
34 各フェーズにおける教訓 AWS Cost Anomaly Detection https://dev.classmethod.jp/articles/aws-cost-anomaly-detection-ga/
35 各フェーズにおける教訓 高額請求発覚直後 とにかく焦らずエビデンスの取得を忘れない 忘れてしまったら CloudTrail で 作成時のイベントを検索!
※新規機能はAPI名がすぐ見つからないケースに注意
36 各フェーズにおける教訓 原因対処完了後 出来る限り多くの情報を整理し、 AWSサポートへ連携。 特に5W1Hを意識した情報提供。 「When:いつ」「Where:どこで」「Who:だれが」 「What:何を」「Why:なぜ」「How:どのように」
37 トピック 高額請求が発生した背景 01 02 04 03 AWSサポートとのやり取り 各フェーズにおける教訓 まとめ
38 まとめ 1 2 3 高額請求は他人事ではない! 高額請求が発生しても焦らない! エビデンスはやりすぎなくらい取得する!
39