Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2024/10 PagerDuty機能アップデート

2024/10 PagerDuty機能アップデート

Kazuto Kusama

October 23, 2024
Tweet

More Decks by Kazuto Kusama

Other Decks in Technology

Transcript

  1. Agenda - PagerDuty Operations CouldとE2Eインシデント管理 - 機能アップデート - PD Advance:

    ⽇本語対応 + MS Teams対応 - Event Orchestration: External Data Variables - Dynamic EP & Service Reassignment - Alert Grouping: Global, Unified, and Enhanced pattern recognition - Incident Types - Operational Maturity: Top Recommendations & Benchmarks - Automation Use Case Library https://www.pagerduty.com/automation/
  2. 動員 解決 ⽂書化 緩和 学習 検知 トリアージ 「インシデント対応」から「E2Eインシデント管理」へ 動員 検知

    監視ツールの 整理‧統合 担当者の通知 インシデント管理として、考慮すべきプロセス全体: 最初にテコ⼊れが検討されるプロセス: インシデントの特定 ⾃動処理 原因を素早く特定 関係者にリアルタイムで状況を共有 運⽤状況の可視化 運⽤プロセスの改善 検知と動員だけでは解決できない課題: • 担当者の負担増 • 解決までに時間がかかる • インシデント対応の可視化と改善 3
  3. Automation Monitoring - On-prem DC ChatOps & Collaboration ITSM/Ticket管理 Code/Config

    Management AI-Based Foundational Data Model PagerDuty Operations Cloud インシデント管理プロセスをEnd-to-Endで標準化 4 動員 解決 記録 緩和 学習 検知 トリアージ 改善 分析 Monitoring - Public Cloud Customer Service Security JP1 Senju Systemwalker Event-Driven Human-in- the-Loop エンドユーザー CEO/CIO/CTO カスタマーサービス 運⽤担当者 あらゆるツールから Eventを集約 - 700+ Integrations - Email 開発者 Status Page
  4. Event Orchestration: Variables利⽤したルー ルを評価‧実⾏ Proprietary & Confidential (Optional) Incident Workflow

    からExternal Variableを更新 外部データ Event B Event A API Event Orchestration Rules (GA) Event Aに関する条件を元に、 Event Aの処理を実⾏ EO Variables (GA) Event Bに関する条件を元に、 Event Aの処理を実⾏ External Data Variables (EA) 任意の外部データに関する条件を 元に、Event Aの処理を実⾏ Event Orchestration Variables 他Eventや外部のデータを参照し、柔軟なEvent Ruleを作成
  5. Dynamic Escalation Policy サービス構成を維持したまま、柔軟な通知先の制御を実現 Proprietary & Confidential 課題: Technical ServiceにEscalation

    Policy が紐づいているため、同⼀Service内で 通知先メンバーを動的に変更すること が難しかった。 例) P1相当のインシデントは、通常のイ ンフラメンバーではなく、SREチームを 直接アサインしたい Dynamic EPによる解決: Event Orchestration Ruleで、動的にEP を変更できるように
  6. Proprietary & Confidential 動的にインシデント のエスカレーション 先を変更 - イベントデータに基づいてエ スカレーションポリシーを動 的に割り当てることで、適切

    な対応者に通知されるように - 組織内のインシデント対応を ⼀元管理 Dynamic Escalation Policies GA (Generally Available) AIOps only
  7. Proprietary & Confidential - インシデントを扱うのに最 適なサービスに、インシデン トを再割り当て - 適切な専⾨家、データ、レ ポートが割り当てられること

    で、対応をスムーズに - ServiceNowなどのITSMツ ールとの双⽅向同期を強化し 、チケットとPagerDutyイン シデント間でサービス変更を 整合させます Service Reassignment 正しいサービスに インシデントを移動 EA (Early Access) - 2025年1⽉ 頃
  8. Service 2 Service 1 Service 2 Service 1 Proprietary &

    Confidential Alert Groupingの進化 Groupingの範囲拡⼤と精度向上 Incident A Incident B Incident A Global Alert Grouping 従来のAlert Grouping Unified Alert Grouping: Intelligent (ML) と Content-Based を組み合わせて利⽤可能に Enhanced Pattern Recognition: MLのパターン判定に利⽤するフィールドの拡⼤‧カスタマイズ 件名 (アラートのタイトル) → 最⼤5つまで任意のフィールドを指定可能に
  9. Proprietary & Confidential サービスをまたいで アラートをグループ化 し、ノイズを削減 - 複数のサービスにわたるア ラートのグループ化により、 ノイズ削減を効率化

    - MLによるIntelligentモード またはコンテンツベースのア ラートグループ化を利⽤ Global Alert Grouping Intelligent/Content (GA) Unified (EA) AIOps only
  10. Proprietary & Confidential 2つのグルーピング モードを併⽤し、 ノイズ削減の精度 を向上 - インテリジェント(ML)モードと コンテンツベースのアラートグ

    ループ化を組み合わせ得ること で、最⼤限のグルーピングの精 度を向上 - コンテンツベースのルールを作 成することで、MLによるグルー ピングを⾏う対象を制限します Single Service (GA) Global (EA) AIOps only Unified Alert Grouping
  11. Proprietary & Confidential MLに追加のメタデー タを適⽤し、グルーピ ング精度を向上 - アラートの類似性を判断する ためのFieldを追加指定すること が可能に

    - アラートのタイトルを変更す ることなく、グルーピングの精 度を向上 Enhanced Pattern Recognition EA GA 2025年1⽉頃 AIOps only
  12. Proprietary & Confidential Incident Types インシデントの種類を定義し、利⽤するCustom FieldsやIWを変更 Incident Typeに合わせて制御でき る項⽬:

    - Custom Fields - Incident Workflows - ChatOps - Status Update Notifications - ServiceNow - Analytics インシデントの重⼤度 担当部署/サービス インシデントの種類 Base Incident Major Incident Security FinOps App A App B
  13. Proprietary & Confidential Incident Types - PagerDutyのインシデントを独 ⾃のビジネスプロセスに合わせ ることができ、より正確な対応 と調整が可能になります。

    - 重⼤インシデント、セキュリテ ィインシデントなど、さまざま なインシデントに対応するカス タム対応プロセスを推進できま す。 - 適切なプロセスに沿ってチーム が時間を節約し、対応中に重要 な⼿順の⾒落としを回避できる よう⽀援します ビジネスプロセスに 合わせて、インシデ ントを分類 Early Access: (w/ Slack, MS Teams, Mobile and Analytics support) GA: 2025年1⽉頃 (w/ ServiceNow ITSM and Analytics for Custom Fields)
  14. Proprietary & Confidential パーソナライズされた推奨事項に より、運⽤成熟度を向上させるた めに最も効果的なアクションを迅 速に特定できます。 業界ベンチマークにより、お客様 のパフォーマンスが同様の企業と ⽐較してどの程度であるかを確認

    できます。 これらの指標は連携して機能し、 改善が必要な領域を特定し、アク ションの優先順位付けを⽀援しま す。 Recommendations (GA) Benchmarks - GA 2025年1⽉頃 Recommendati ons & Benchmarking 運⽤改善につなが る実践的な提案
  15. PagerDuty Resources PagerDuty クイックガイド(⽇本語) - 利⽤ガイド https://qiita.com/ymotomu/items/42f825accbfca287464a - 設定ガイド https://qiita.com/ymotomu/items/e6d13e5284a62e3a1100

    PagerDuty 株式会社公式HP (無料トライアル申込み/導⼊事例/価格) https://www.pagerduty.co.jp/ PagerDuty 公式ユーザードキュメント https://support.pagerduty.com/lang-ja/docs Integration Guide (モニタリングツール‧コラボレーションツール等との連携⽅法) https://www.pagerduty.com/integrations/ インシデント対応プロセスのベストプラクティス (英語) https://response.pagerduty.com/ (有志のユーザー様による⽇本語翻訳版) 20