Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Ops Guidesから読み解くインシデントレスポンスにおけるカスタマーリエゾンの役割

Ops Guidesから読み解くインシデントレスポンスにおけるカスタマーリエゾンの役割

第25回 Customer系エンジニア座談会 LT
https://customer-x-engineer.connpass.com/event/343702/

Avatar for Meiko Hori

Meiko Hori

May 21, 2025
Tweet

More Decks by Meiko Hori

Other Decks in Technology

Transcript

  1. 自己紹介 堀 明子 (Meiko Hori) X: @m3iq 略歴 SIerにて客先システム開発・運用 -> CScE/CRE

    @Autify -> Professional Service @PagerDuty Japan 趣味 旅行・音楽・酒飯・翻訳 Coming soon… (July 2025)
  2. PagerDutyについて 1. 検知 2. トリアージ 3. 動員 4. 協⼒/解決 5.

    学習/予防 インシデントを特定 ⾃動処理 運⽤改善のための 知⾒を提供 最適な担当者に通知 迅速な解決を⽀援 あらゆるツールから イベントを受信 架電、 SMS、メール Appプッシュ通知、チャット ⾃動エスカレーション スケジュール管理 診断‧修復作業の⾃動化 チーム内外と円滑に連携 クラウド コンテナ マイクロサービス ネットワーク アプリ‧サービス セキュリティ データベース サーバー ソーシャル 担当者が最適な 通知⽅法を選択 対応履歴 MTTA/MTTR 分析 担当者の負荷状況 ポストモーテム 解決のヒントを提⽰ • 過去の類似インシデント • 直近の構成/コード変更 ...etc. 91% ノイズ削減 700+ Integrations Operations Cloud: インシデントをより早く‧少ないリソースで解決 / 将来のインシデントを未然に防ぐ
  3. Ops Guides/Incident Response(日本語版) https://response.pagerduty.co.jp • インシデント対応プロセスに関する、 PagerDuty内部⽂書の縮⼩版 • PagerDutyを利⽤していなくても活⽤可 (インシデント対応の準備‧発⽣時‧発⽣後に

    それぞれ何をすべきか、⼀般化して記載) • 以下の⽅を読者として想定対象 ◦ オンコールの実務担当者 ◦ 現在運⽤中のインシデント対応プロセスに携わる⽅ ◦ 今後、正式なインシデント対応プロセスを制定したい⽅ • 動画のトレーニングコースや、アンチパターンも公開 Training Course - https://response.pagerduty.co.jp/training/courses/incident_response/ Anti-Patterns - https://response.pagerduty.co.jp/resources/anti_patterns/ GitHub - https://github.com/PagerDuty/incident-response-docs
  4. Ops Guidesにおける「インシデント」の定義 https://response.pagerduty.co.jp/before/what_is_an_incident/ 顧客のサービス利用 に 顕著な影響を及ぼす 計画外のサービスの 中断や低下 複数のチームによる 協調の取れた対応を

    必要とするものを 重大インシデントと呼ぶ 中でも... 代表的なメトリクスの例 PagerDuty「1秒あたりの送信通知数」 Amazon「1秒あたりの注文数」 Netflix「1秒あたりのストリーム開始数」
  5. Ops Guidesにおける「インシデント」の定義 https://response.pagerduty.co.jp/before/what_is_an_incident/ 顧客のサービス利用 に 顕著な影響を及ぼす 計画外のサービスの 中断や低下 複数のチームによる 協調の取れた対応

    を 必要とするものを 重大インシデントと呼ぶ 中でも... 「顧客(カスタマー)」は社外の人たちかもしれないし、社内 の人たちかもしれないし、両方のこともある 影響を最小限に留め、時間とコストを抑えながら 価値提供できる状態をいかにして回復するか
  6. インシデント対応におけるさまざまな役割 https://response.pagerduty.co.jp/before/different_roles/ • 指揮担当(コマンドスタッフ) ◦ インシデントコマンダー ◦ 副指揮官(補佐係) ◦ 書記官(記録係)

    • コミュニケーション担当 ◦ カスタマーリエゾン ◦ インターナルリエゾン • 解決に向けて手を動かす担当 ◦ 対象分野の専門家/SME (Subject Matter Expert)
  7. カスタマーリエゾンとしてのコツ https://response.pagerduty.co.jp/training/customer_liaison/ • 正直であること ◦ 嘘をつかず、推測もしない。実際に何が起きているのか不明な場合は、インシデントコ マンダーと協力して確認する ◦ 顧客に透明性のある情報を提供する。もし対応に手間取っている場合は、それを率直 に伝える

    • インシデント解決の進捗状況を説明する ◦ 問題を認識したての段階か、調査中か、修正を適用中か、 etc. • インシデントが顧客にどのような影響を与えているのかを明確にする ◦ 顧客が最も気にすること。自分たちにとって、なににどこまで影響があるのか • インシデントが解決するまでの間、顧客が使用できる回避策を提供する ◦ 顧客が実現したい目的がなんらかの形で達成できるように 結構むずい!
  8. 参考文献 • 公式ブログ: あのOps Guidesインシデント対応ガイドが、ついに公式日本語化! ◦ https://www.pagerduty.co.jp/blog/incident-response-guide-jp/ • 英語版Ops Guides

    - Incident Response ◦ https://response.pagerduty.com/ ◦ https://github.com/PagerDuty/incident-response-docs • PagerDutyにおける重大インシデントの公開例 ◦ https://status.pagerduty.com/posts/details/PSSMA75