ゲームから学ぶ、いちばん速いインシデント対応

Slide 1

Slide 1 text

ゲームから学ぶいちばん速いインシデント対応 PagerDuty - Product Evangelist Kazuto Kusama @jacopen

Slide 28

Slide 28 text

マニュアルリアクティブレスポンシブ積極的予防的問題は社内チームではなく顧客によって特定される。オペレーションプロセスはレガシーシステムに依存しており、インシデントは手動で発生し、チケットシステムなどのキューイングワークフローを使用して処理される。緊急時に専門家に迅速にアクセスするための仕組みがほとんどない。常に消火モード初期の技術投資により、クラウドホスティングやアプリケーションの成熟度に応じてリアルタイムでの可視化と動員が可能になる。分散型チームのアプローチが見られるが、スキルはサイロ化されている。インシデントを管理するための明確なプロセスがない。問題が発生する前に先回り優れた顧客体験が常に維持される。機械学習に基づく予測的な修正が行われる。組織全体で一貫したベストプラクティスが実施される。高度に自動化されたプロセスにより、雑務やエスカレーションが排除される。継続的な学習、改善、予防が技術的でない関係者を含む組織全体で行われる。チームは変更の将来的な影響を予測できる。問題が発生するたびに解決チームは顧客に影響を与える問題をより迅速に把握できる。機械学習を使用して潜在的な問題を特定し、誤検知を減らし、ノイズを低減する。問題は自動的に特定され、専門家によって対応されるが、適切なチームを編成することは依然として課題である。分散型チームがマイクロサービスの完全な責任を持つようになる。シームレスで協調的な問題管理問題は顧客が気付く前に技術チームによって検出・修正される。問題に関する情報は、ビジネスのステークホルダーを含む適切な人物に提供される。プログラム学習と最適化の機会の特定が一般化している。分散型チームは、サービス変更の影響を理解し、運用の責任を完全に負う。チームとして対応し、運用の成熟度を上げていく

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text