Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
システム障害の報告をBacklogにしたら随分負担が減った話/JBUG_Tokyo6
Search
Ichiro Nishiuma
November 02, 2018
Technology
3
8.6k
システム障害の報告をBacklogにしたら随分負担が減った話/JBUG_Tokyo6
2018/11/02のJBUG東京#6の資料です
Ichiro Nishiuma
November 02, 2018
Tweet
Share
More Decks by Ichiro Nishiuma
See All by Ichiro Nishiuma
社内の学びの場・コミュニティ形成とエンジニア同士のリレーションシップ構築/devreljapan2024
nishiuma
3
350
日経電子版から始まった内製開発の現在地と向き合っている課題/inhouse
nishiuma
0
310
エンジニア採用を起点に取り組む組織の改善活動と課題、中長期のタスク管理/ #HRmethod
nishiuma
4
3.7k
みんなで盛り上げ築くリレーション、日経の新卒エンジニア研修 #chiyoda_tech
nishiuma
1
260
回り回って効いてくる副次的効果としての技術広報/techpr
nishiuma
2
380
自らを知り外と繋がる、日経のエンジニア採用とDevRel活動/devreljp92
nishiuma
3
350
技術イベントはなんとかひねり出す 日経の技術広報の取り組み/techpr3
nishiuma
1
490
日経におけるエンジニア組織づくりで直面した課題と施策/engineerorganization #nikkei_tech_talk
nishiuma
0
350
日経におけるクラウド人材育成と 技術コミュニティ/human-resource-dev
nishiuma
0
55
Other Decks in Technology
See All in Technology
Taming you application's environments
salaboy
0
190
Platform Engineering for Software Developers and Architects
syntasso
1
520
マルチモーダル / AI Agent / LLMOps 3つの技術トレンドで理解するLLMの今後の展望
hirosatogamo
37
12k
インフラとバックエンドとフロントエンドをくまなく調べて遅いアプリを早くした件
tubone24
1
430
Lexical Analysis
shigashiyama
1
150
OCI Security サービス 概要
oracle4engineer
PRO
0
6.5k
アジャイルでの品質の進化 Agile in Motion vol.1/20241118 Hiroyuki Sato
shift_evolve
0
170
適材適所の技術選定 〜GraphQL・REST API・tRPC〜 / Optimal Technology Selection
kakehashi
1
680
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
2
610
Zennのパフォーマンスモニタリングでやっていること
ryosukeigarashi
0
120
SSMRunbook作成の勘所_20241120
koichiotomo
3
150
マルチプロダクトな開発組織で 「開発生産性」に向き合うために試みたこと / Improving Multi-Product Dev Productivity
sugamasao
1
310
Featured
See All Featured
Designing Experiences People Love
moore
138
23k
Statistics for Hackers
jakevdp
796
220k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.3k
YesSQL, Process and Tooling at Scale
rocio
169
14k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
A Philosophy of Restraint
colly
203
16k
Designing on Purpose - Digital PM Summit 2013
jponch
115
7k
How to Think Like a Performance Engineer
csswizardry
20
1.1k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.8k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.8k
Building Your Own Lightsaber
phodgson
103
6.1k
Transcript
システム障害の報告をBacklogに したら随分負担が減った話 JBUG (東京#6) 2018/11/02(金) 日本経済新聞社 デジタル事業 BtoCユニット 西馬一郎
きょうお話したいこと 障害の報告でBacklogを活用、特にテンプ レート機能が有用であること 効果 • 障害のレポートを上の人にスムーズに実施 • 周りの人への情報共有のスピードアップ • テンプレート機能により定形フォーマット
で記載が楽、抜け漏れやブレが無くなる
自己紹介 • 西からきた馬ヅラのオトコ • 日経電子のバーンのエンジニア – 2010年、電子版創刊 – 2015年、電子版AWS移行 –
2017年、電子版完全https化対応 – 直近は、API開発や認証システム • JBUG、JAWS-UGコミュニティ活動 • サウナが大好き 3
ヌーラボさんとの関連で 弊社紹介(ビジネス図解モデル繋がり) 4
システム障害の報告をBacklogに したら随分負担が減った話
障害情報の管理で課題 • (Backlog無い時) 管理の課題 – 管理・蓄積されていない – 報告書の記載レベル・粒度がバラバラ – 検索できない
– 格納場所がバラバラ • 文書作成ソフトウエアで1人が記載 • メール • 共有フォルダ • slack – ノウハウが蓄積されず、記憶に頼る属人的 6
そこで、Backlogで障害情報の管理 • (Backlogある時)障害情報を登録、共有 – 2016年から登録開始 – お客様に影響が出た障害を対象にする • 目的 –
対応履歴、アクションを記録し、振り返る – 蓄積して頻度や傾向分析 – 1件に対して複数のメンバーが記述し内容を充実 7
負担の軽減と効果 • 一元管理と蓄積 • 記載レベルが揃い、抜け漏れ解消 • 検索が可能、ノウハウ蓄積 • 上の人への報告の手間が省けた •
エンジニア間、上長との間で情報の非対称性が解消 • 複数のメンバーで編集、いろんな角度で事象を捉える – システム観点、ビジネスインパクトの観点 • レビューにより客観性を担保 8
テンプレート機能でさらに効率UP 2018年8月にリリース 9
テンプレートの内容 # 障害内容 - 発生した障害の詳細を記載 ## 影響範囲 - 影響範囲を記載する ##
ユーザ問い合わせ - わかっている範囲でユーザ問い合わせの 有無/件数を記載 # 障害日時 ## 発生時刻 ## 収束時刻 10 # 検知経路 - 障害の検知経路を記載 # 原因 # 対応 # アクションアイテム(再発防止策) # 教訓(以下、SRE 観点で可能な範囲で記載) ## うまくいったこと ## うまくいかなかったこと ## 幸運だったこと
まとめ • 日経電子版ではBacklogで障害管理、情報共有 – テンプレートを適用して効率アップ • 効果 – 定形フォーマットで抜け漏れ解消 –
対応履歴、アクションを記録、振り返る – 蓄積して頻度や傾向分析 – 複数のメンバーが記述し内容を充実 – レビューにより客観性を担保 – SRE(Site Reliability Engineering)視点でポストモーテム の要素を追加 11
ソルムと言います ヌーラボさんのプロダクトと相性良さそう 12
以上おしまいです 13