Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害を発生させないために
Search
s_tanaka
November 10, 2017
Education
0
570
障害を発生させないために
社内LT(2017/11/10)
s_tanaka
November 10, 2017
Tweet
Share
Other Decks in Education
See All in Education
VALORS A IMPULSAR
cumclavis
PRO
0
130
week3@tcue2024
nonxxxizm
0
620
2024年度春学期 統計学 第12回 分布の平均を推測する ー 区間推定 (2024. 6. 27)
akiraasano
PRO
1
110
Servizo de correo
irocho
0
470
week5@tcue2024
nonxxxizm
0
610
〜AWS初心者向け〜 ベストプラクティスから学ぶ 「AWSセキュリティの高め方」
koheiyoshikawa
0
670
Introduction - Lecture 1 - Next Generation User Interfaces (4018166FNR)
signer
PRO
1
3.3k
week4@tcue2024
nonxxxizm
0
520
#英語力ランキング批判:EF-EPI,TOEFLスコア,英語教育実施状況調査
terasawat
0
450
3Dプリンターの使い方(Sovol 06 Plus)
404background
0
150
week@tcue2024
nonxxxizm
0
360
AGU情報社会論 2024 #03 "CC BY-SA"
fullfull
0
140
Featured
See All Featured
The Invisible Side of Design
smashingmag
294
50k
Atom: Resistance is Futile
akmur
261
25k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
662
120k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
121
18k
Docker and Python
trallard
37
2.9k
Pencils Down: Stop Designing & Start Developing
hursman
118
11k
In The Pink: A Labor of Love
frogandcode
139
22k
Documentation Writing (for coders)
carmenintech
63
4.2k
Building Your Own Lightsaber
phodgson
101
5.9k
Agile that works and the tools we love
rasmusluckow
325
20k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
34
1.9k
RailsConf 2023
tenderlove
16
720
Transcript
障害を発生させないために @s_tanaka
アジェンダ そもそも障害ってなに? なんで障害は発生するの? 障害を起こさないために何をすれば良いの? 障害が起きたときどうすれば良いの?
アジェンダ そもそも障害ってなに? なんで障害は発生するの? 障害を起こさないために何をすれば良いの? 障害が起きたときどうすれば良いの?
障害とは? システムの構成要素であるハードウェアの故障、ソフトウェアのバグやその他の機能不 全が原因となって、システムが本来の機能をユーザに対して提供できない状態を言う。 (Wikipedia 「障害 -情報技術分野での障害(Fault)」) システムが仕様(思い)通りに動作しないこと ※仕様が間違っている場合もある…
アジェンダ そもそも障害ってなに? なんで障害は発生するの? 障害を起こさないために何をすれば良いの? 障害が起きたときどうすれば良いの?
発生する要因 コミュ不足 作業ミス ハード故障 運用 バグ 仕様漏れ テスト不足 不明 どっかで見たこと
あるぞ? AAのインシデント管理システム
テスト不足 発生した要因で一番多いのが「テスト不足」 そもそも試験しなかった 試験したけど不十分だった(パターンから漏れていた) そんなところに影響があるなんて思わなかった バグ + テスト不足 と言うのも多い →バグがあってもテストをちゃんとやっておけば気付けた
なぜテスト不足が発生するのか
アジェンダ そもそも障害ってなに? なんで障害は発生するの? 障害を起こさないために何をすれば良いの? 障害が起きたときどうすれば良いの?
気づきのポイント 要件定義 •要件定義書 設計 •設計書 実装 •コード 試験 •試験仕様書 リリース
•リリース手 順書 各工程で漏れがなければ障害の発生はかなり抑えられる →それぞれのOutputをチェックすることで、その工程は(ある程度)担保される 各工程と成果物(Output)
がしかし… 今まで 要件定義 設計 実装 試験 リリース 1人日 1人日 3人日
1人日 0.5人日 計6.5人日 全部やると 要件定義 設計 実装 試験 リリース 1人日 1人日 3人日 1人日 0.5人日 計11.5人日 0.5人日 ×2 0.5人日 ×2 0.5人日 ×2 1人日 ×2 0.5人日 ×2
なので プロジェクト全体の大きさに応じて各工程のアウトプットの有無、レビューの有無を決 めよう。 …それだと、いつもと変わらないので、 試験仕様書の作成と、それの確認を行ってはいかがだろうか。 ライトな開発でも、行った動作確認の流れや、画面表示があればキャプチャを貼るなど で、確認項目の共有(他の人がわかりやすい)や、自分自身での確認、今後同様の開発 があった場合の注意点となる。
テスト不足になる理由 要件定義 設計 実装 試験 リリース リリースまで時間が無く、実装を進めながら仕様の調整、試験と言うよりは動作確認の みになってしまう場合が多い(気がしている)。 コードレビューは行っているが、それだけではそのシステムに詳しくない限り、潜在し ているバグや仕様漏れに気付くのは難しい(私だけ?)
バグを発見する可能性で言えば試験が重要 →テスト不足の障害が少なくなるのでは?
アジェンダ そもそも障害ってなに? なんで障害は発生するの? 障害を起こさないために何をすれば良いの? 障害が起きたときどうすれば良いの?
障害は発生する 気を付けていても予期せぬ要因で障害は発生する 障害が発生しないようにも重要だが、障害が発生してからの対応も重要。
障害が発生したら 暫定 対応? 状況の確認 障害発生 関係者に 連絡 暫定対応 内容の検討 暫定対応
解消? Y N 恒久対応 内容の検討 N Y 恒久対応 解決? 関係者に 連絡 N Y インシデント レポート インシデントレポートは 社内で共有
障害の報告 第一報には下記をわかる範囲でまとめる 発生事象 発生日時 (判明していれば)原因 (わかっていれば)解消予定時間 事象が解決したら、下記も調べて報告する 発生期間 影響範囲 対応内容
上記にプラスして、インシデントレポートでは再発防止策があれば記載する
最後に 障害は時間が無い場合に発生する。 時間が無いと、試験の時間を削ってしまう場合が多いから。 時間が無いというときは、危ないなと思い、実装だけじゃなく、試験の時間も確保出来 るようにしましょう。 試験仕様書は、作成することで、パターンの洗い出しや、実装の漏れに気付く場合もあ るので、未知なるアプリ、機能の改修の場合、文字に起こして整理することが大事。 共有されたインシデントレポートから、障害になりやすい内容についても試験を行うこ とで、より障害の発生の可能性を下げられる。 チームで障害が発生しない仕組みを考えましょう。
試験仕様書(をはじめ、ドキュメント類)は標準化し、作成のコストを抑えたい