Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up
for free
障害はチャンスだ! 障害を前向きに捉える
Recruit Technologies
November 04, 2020
Technology
0
99
障害はチャンスだ! 障害を前向きに捉える
2020/11/04_ Data Engineering Study #4「データ分析基盤の障害対応事例LT祭り」での、山田の講演資料になります
Recruit Technologies
November 04, 2020
Tweet
Share
More Decks by Recruit Technologies
See All by Recruit Technologies
rtechkouhou
0
1.2k
rtechkouhou
0
220
rtechkouhou
1
510
rtechkouhou
1
29k
rtechkouhou
1
29k
rtechkouhou
0
29k
rtechkouhou
2
31k
rtechkouhou
7
32k
rtechkouhou
1
31k
Other Decks in Technology
See All in Technology
sansandsoc
2
810
yshr1200
0
170
gamella
3
1.5k
minma
0
210
yuzutas0
8
3.1k
sansandsoc
0
280
tricknotes
0
130
swoon
1
620
kanaugust
PRO
0
120
sadayoshitada0919
0
360
udonyuya
1
560
miyake
1
490
Featured
See All Featured
jmmastey
10
620
holman
447
130k
62gerente
587
200k
qrush
285
19k
maggiecrowley
10
500
philnash
9
590
chriscoyier
779
240k
mza
80
4.1k
kneath
219
15k
brianwarren
82
4.7k
bkeepers
52
4.2k
smashingmag
283
47k
Transcript
障害はチャンスだ! 障害を前向きに捉える 2020/11/04 Data Engineering Study #4 株式会社リクルート 山田 雄
Hobby & Ability ビール/日本酒/ゴルフ/トミカ/子育て 山田 雄(Yamada Yu) @nii_yan 社会人歴 20年ぐらい データエンジニア
(データ基盤の開発・運用) AWS/GCP/BigData/Mail/Hadoop...
None
None
None
データ基盤は一度出来ると使えるのが当 たり前になり、エンジニアは責められる 事があっても褒められる事はなくなる
なので 障害対応は とても重要です!
障害対応 によって得られる事もある
None
障害対応時に起きること モブプロ/ペアプロになり、他の人のコマンドを見られる その場にいる人での対応なので、知らないシステムでも仕様を知れる →障害対応は自身の能力を伸ばせるチャンス!! 障害対応には率先してあたりましょう 障害対応時のルールを事前に定めておくことも重要
障害は 振り返りが とても大事
ポストモーテム 障害の事後検証報告書 ポストモーテムを作る事によって障害復旧に携わった本人以外に、 組織も成長出来る。 googleで障害が起きた時などにも発表される ・BACKGROUND ・ISSUE SUMMARY ・ROOT CAUSE
・REMEDIATION AND PREVENTION ・DETAILED DESCRIPTION OF IMPACTなど・・・
ポストモーテム例 ▪概要 ▪インパクト ▪根本原因 ▪発生原因 根本原因よりも深堀りした内容 ▪対応 ▪教訓 ・うまくいったこと ・うまくいかなかったこと
・幸運だったこと ▪タイムライン ・yyyy-MM-dd HH:mm:ss など出来るだけ細かく ▪再発防止策
まとめ • 障害は起きないに越した事はない ◦ ですが、障害の起きないシステムは存在しない • 障害は、人も組織も成長出来るチャンスでもある ◦ 障害対応の仕方によって基盤の価値が変わる
Fin.