Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
障害はチャンスだ! 障害を前向きに捉える
Recruit Technologies
November 04, 2020
Technology
0
400
障害はチャンスだ! 障害を前向きに捉える
2020/11/04_ Data Engineering Study #4「データ分析基盤の障害対応事例LT祭り」での、山田の講演資料になります
Recruit Technologies
November 04, 2020
Tweet
Share
More Decks by Recruit Technologies
See All by Recruit Technologies
Flutter移行の苦労と、乗り越えた先に得られたもの
rtechkouhou
3
8.2k
ここ数年間のタウンワークiOSアプリのエンジニアのチャレンジ
rtechkouhou
1
1.3k
大規模環境をAWS Transit Gatewayで設計/移行する前に考える3つのポイントと移行への挑戦
rtechkouhou
1
1.6k
【61期 新人BootCamp】TOC入門
rtechkouhou
2
38k
【RTC新人研修 】 TPS
rtechkouhou
1
37k
Android Boot Camp 2020
rtechkouhou
1
37k
HTML/CSS
rtechkouhou
5
39k
TypeScript Bootcamp 2020
rtechkouhou
9
41k
JavaScript Bootcamp 2020
rtechkouhou
2
39k
Other Decks in Technology
See All in Technology
OpenShift.Run2023_create-aro-with-terraform
ishiitaiki20fixer
1
170
私見「UNIXの考え方」/20230124-kameda-unix-phylosophy
opelab
0
160
ChatGPT for Hacking
anugrahsr
0
1.5k
それでもどうしてRecoilを使うのか / Harajuku.ts Meetup Recoil
okunokentaro
13
3.6k
オンプレk8sとEKSの並行運用の実際
ch1aki
0
160
Optimizing your Swift code
kateinoigakukun
0
1.3k
Pentesting Password Reset Functionality
anugrahsr
0
210
2022年に起きたフロントエンドの変化
sakito
29
17k
20230123_FinJAWS
takuyay0ne
0
110
目指せCoverage100%! AutoScale環境におけるSavings Plans購入戦略 / JAWS-UG_SRE_Coverage
taishin
0
360
230125 古いタブレットの活用 かーでぃさん
comucal
PRO
0
7.4k
SmartHRからOktaへのSCIM連携で作り出すHRドリブンのアカウント管理
jousysmiler
1
110
Featured
See All Featured
The Invisible Customer
myddelton
113
12k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
32
6.7k
Done Done
chrislema
178
14k
The World Runs on Bad Software
bkeepers
PRO
59
5.7k
How New CSS Is Changing Everything About Graphic Design on the Web
jensimmons
214
12k
Intergalactic Javascript Robots from Outer Space
tanoku
261
26k
A designer walks into a library…
pauljervisheath
198
16k
What the flash - Photography Introduction
edds
64
10k
GitHub's CSS Performance
jonrohan
1020
430k
Infographics Made Easy
chrislema
235
17k
Adopting Sorbet at Scale
ufuk
65
7.8k
How to Ace a Technical Interview
jacobian
270
21k
Transcript
障害はチャンスだ! 障害を前向きに捉える 2020/11/04 Data Engineering Study #4 株式会社リクルート 山田 雄
Hobby & Ability ビール/日本酒/ゴルフ/トミカ/子育て 山田 雄(Yamada Yu) @nii_yan 社会人歴 20年ぐらい データエンジニア
(データ基盤の開発・運用) AWS/GCP/BigData/Mail/Hadoop...
None
None
None
データ基盤は一度出来ると使えるのが当 たり前になり、エンジニアは責められる 事があっても褒められる事はなくなる
なので 障害対応は とても重要です!
障害対応 によって得られる事もある
None
障害対応時に起きること モブプロ/ペアプロになり、他の人のコマンドを見られる その場にいる人での対応なので、知らないシステムでも仕様を知れる →障害対応は自身の能力を伸ばせるチャンス!! 障害対応には率先してあたりましょう 障害対応時のルールを事前に定めておくことも重要
障害は 振り返りが とても大事
ポストモーテム 障害の事後検証報告書 ポストモーテムを作る事によって障害復旧に携わった本人以外に、 組織も成長出来る。 googleで障害が起きた時などにも発表される ・BACKGROUND ・ISSUE SUMMARY ・ROOT CAUSE
・REMEDIATION AND PREVENTION ・DETAILED DESCRIPTION OF IMPACTなど・・・
ポストモーテム例 ▪概要 ▪インパクト ▪根本原因 ▪発生原因 根本原因よりも深堀りした内容 ▪対応 ▪教訓 ・うまくいったこと ・うまくいかなかったこと
・幸運だったこと ▪タイムライン ・yyyy-MM-dd HH:mm:ss など出来るだけ細かく ▪再発防止策
まとめ • 障害は起きないに越した事はない ◦ ですが、障害の起きないシステムは存在しない • 障害は、人も組織も成長出来るチャンスでもある ◦ 障害対応の仕方によって基盤の価値が変わる
Fin.