Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20241024_an_real_horror_story_for_for_engineer
Search
snowwhite
October 25, 2024
0
66
20241024_an_real_horror_story_for_for_engineer
2024年10月24日に実施しました、「本当にあった恐怖物語、エンジニア編」の登壇資料です。
snowwhite
October 25, 2024
Tweet
Share
More Decks by snowwhite
See All by snowwhite
20251108_SecJAWS_IAMSp
yuri_snowwhite
0
20
20250730_AWS_AmazonQ
yuri_snowwhite
1
86
20250601_storage_and_bigdate_JAWS
yuri_snowwhite
1
66
250226_SecurityJAWS
yuri_snowwhite
2
1.1k
20250521 yumemi_grow _ finatext
yuri_snowwhite
2
330
JAWS-UG IoT_Switchbot Notify To Discord
yuri_snowwhite
1
720
Security.Any #2
yuri_snowwhite
1
140
20240712_JAWSUG-FUKUOKA_Cloudgirl
yuri_snowwhite
0
75
2024/05/23_SecurityJAWS登壇
yuri_snowwhite
1
920
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.2k
Designing for humans not robots
tammielis
254
26k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
116
20k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
How to train your dragon (web standard)
notwaldorf
97
6.4k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Transcript
本当にあった怖い話 ~何処へ消えた本番環境~ 2024.10.24 株式会社ゆめみ 白"雪姫"
自己紹介 • 砂岡 雪 a.k.a 白"雪姫" ◦ 雪(さん・ちゃん)もしくは、しらゆきでよんでもらっている • 2023年8月入社
◦ セキュリティとネットワークのお姉さん ◦ AWSの認定資格もいくつか保有(CLF/SAA/SAPro/ANS/SCS) • 入社まで ◦ 決済システムの業界で10年弱受託案件によるインフラ設計・ 保守・構築を実施していた • ブログ&X ◦ X→ @yuri_snowwhite ◦ ブログ→ http://d.hatena.ne.jp/kohaku_kageroh/ ↑ 余談:本人画像 を生成AIで学生 ・2次元化
突然ですが質問 です 本番環境が突然消えたことありません か?
私はあります!! • 同時進行で進んでた案件が2件 ◦ このうち1件のために、某県のデータセンターへ 車で出張していた。 ◦ 同時進行で進めていたもう 1件の会社側の方の担当者からひっきりなしに電話が来る。 •
電話が来てた理由は・・・・? ◦ 突然サイトが表示されなくなったんだけど ?!?! ◦ サイト更新したいから早く復旧して !!
何が起きてたの? • 当時使っていたVMインスタンスが削除されていた ◦ VMの管理コンソールにログインしたところ「停止」ではなく「 終了」となっていた。 ▪ つまり、削除されていた。。。。バックアップから戻すか・・・
これで終わりじゃ無かった!
スナップショットバックアップが無い データバックアップシェルが動いてない (負荷対策で止めてくれと頼まれていた )
ないないづくしでどうする?!?!
片道2時間の運転 (往復後)に徹夜で直す事に • やったこと ◦ OSの初期設定 <1時間> ◦ ミドルウェアの設定 <1時間> ◦
当時使っていたCMSのインストール <2時間半 > ◦ お客様が使ってたテーマの導入 <1時間半> ◦ お客様が持ってる過去データ導入 <3時間> 合計8時間かかって復旧!!!
教訓 • データバックアップはちゃんと取りましょう • リカバリテストもしておこうね! • 復旧できる手順をまとめておこう!
ご静聴ありがとうございました