Slide 1

Slide 1 text

PagerDuty 機能アップデート 2024年10⽉

Slide 2

Slide 2 text

Agenda - PagerDuty Operations CouldとE2Eインシデント管理 - 機能アップデート - PD Advance: ⽇本語対応 + MS Teams対応 - Event Orchestration: External Data Variables - Dynamic EP & Service Reassignment - Alert Grouping: Global, Unified, and Enhanced pattern recognition - Incident Types - Operational Maturity: Top Recommendations & Benchmarks - Automation Use Case Library https://www.pagerduty.com/automation/

Slide 3

Slide 3 text

動員 解決 ⽂書化 緩和 学習 検知 トリアージ 「インシデント対応」から「E2Eインシデント管理」へ 動員 検知 監視ツールの 整理‧統合 担当者の通知 インシデント管理として、考慮すべきプロセス全体: 最初にテコ⼊れが検討されるプロセス: インシデントの特定 ⾃動処理 原因を素早く特定 関係者にリアルタイムで状況を共有 運⽤状況の可視化 運⽤プロセスの改善 検知と動員だけでは解決できない課題: ● 担当者の負担増 ● 解決までに時間がかかる ● インシデント対応の可視化と改善 3

Slide 4

Slide 4 text

Automation Monitoring - On-prem DC ChatOps & Collaboration ITSM/Ticket管理 Code/Config Management AI-Based Foundational Data Model PagerDuty Operations Cloud インシデント管理プロセスをEnd-to-Endで標準化 4 動員 解決 記録 緩和 学習 検知 トリアージ 改善 分析 Monitoring - Public Cloud Customer Service Security JP1 Senju Systemwalker Event-Driven Human-in- the-Loop エンドユーザー CEO/CIO/CTO カスタマーサービス 運⽤担当者 あらゆるツールから Eventを集約 - 700+ Integrations - Email 開発者 Status Page

Slide 5

Slide 5 text

PagerDuty Operations Cloud リファレンスアーキテクチャ

Slide 6

Slide 6 text

状況を教えて 以前の類似インシデントは どうやって解決した? 最近⾏った変更は? ⽇本語(GA)‧MS Teams(EA)のサポート

Slide 7

Slide 7 text

Event Orchestration: Variables利⽤したルー ルを評価‧実⾏ Proprietary & Confidential (Optional) Incident Workflow からExternal Variableを更新 外部データ Event B Event A API Event Orchestration Rules (GA) Event Aに関する条件を元に、 Event Aの処理を実⾏ EO Variables (GA) Event Bに関する条件を元に、 Event Aの処理を実⾏ External Data Variables (EA) 任意の外部データに関する条件を 元に、Event Aの処理を実⾏ Event Orchestration Variables 他Eventや外部のデータを参照し、柔軟なEvent Ruleを作成

Slide 8

Slide 8 text

Dynamic Escalation Policy サービス構成を維持したまま、柔軟な通知先の制御を実現 Proprietary & Confidential 課題: Technical ServiceにEscalation Policy が紐づいているため、同⼀Service内で 通知先メンバーを動的に変更すること が難しかった。 例) P1相当のインシデントは、通常のイ ンフラメンバーではなく、SREチームを 直接アサインしたい Dynamic EPによる解決: Event Orchestration Ruleで、動的にEP を変更できるように

Slide 9

Slide 9 text

Proprietary & Confidential 動的にインシデント のエスカレーション 先を変更 - イベントデータに基づいてエ スカレーションポリシーを動 的に割り当てることで、適切 な対応者に通知されるように - 組織内のインシデント対応を ⼀元管理 Dynamic Escalation Policies GA (Generally Available) AIOps only

Slide 10

Slide 10 text

Proprietary & Confidential - インシデントを扱うのに最 適なサービスに、インシデン トを再割り当て - 適切な専⾨家、データ、レ ポートが割り当てられること で、対応をスムーズに - ServiceNowなどのITSMツ ールとの双⽅向同期を強化し 、チケットとPagerDutyイン シデント間でサービス変更を 整合させます Service Reassignment 正しいサービスに インシデントを移動 EA (Early Access) - 2025年1⽉ 頃

Slide 11

Slide 11 text

Service 2 Service 1 Service 2 Service 1 Proprietary & Confidential Alert Groupingの進化 Groupingの範囲拡⼤と精度向上 Incident A Incident B Incident A Global Alert Grouping 従来のAlert Grouping Unified Alert Grouping: Intelligent (ML) と Content-Based を組み合わせて利⽤可能に Enhanced Pattern Recognition: MLのパターン判定に利⽤するフィールドの拡⼤‧カスタマイズ 件名 (アラートのタイトル) → 最⼤5つまで任意のフィールドを指定可能に

Slide 12

Slide 12 text

Proprietary & Confidential サービスをまたいで アラートをグループ化 し、ノイズを削減 - 複数のサービスにわたるア ラートのグループ化により、 ノイズ削減を効率化 - MLによるIntelligentモード またはコンテンツベースのア ラートグループ化を利⽤ Global Alert Grouping Intelligent/Content (GA) Unified (EA) AIOps only

Slide 13

Slide 13 text

Proprietary & Confidential 2つのグルーピング モードを併⽤し、 ノイズ削減の精度 を向上 - インテリジェント(ML)モードと コンテンツベースのアラートグ ループ化を組み合わせ得ること で、最⼤限のグルーピングの精 度を向上 - コンテンツベースのルールを作 成することで、MLによるグルー ピングを⾏う対象を制限します Single Service (GA) Global (EA) AIOps only Unified Alert Grouping

Slide 14

Slide 14 text

Proprietary & Confidential MLに追加のメタデー タを適⽤し、グルーピ ング精度を向上 - アラートの類似性を判断する ためのFieldを追加指定すること が可能に - アラートのタイトルを変更す ることなく、グルーピングの精 度を向上 Enhanced Pattern Recognition EA GA 2025年1⽉頃 AIOps only

Slide 15

Slide 15 text

Proprietary & Confidential Incident Types インシデントの種類を定義し、利⽤するCustom FieldsやIWを変更 Incident Typeに合わせて制御でき る項⽬: - Custom Fields - Incident Workflows - ChatOps - Status Update Notifications - ServiceNow - Analytics インシデントの重⼤度 担当部署/サービス インシデントの種類 Base Incident Major Incident Security FinOps App A App B

Slide 16

Slide 16 text

Proprietary & Confidential Incident Types - PagerDutyのインシデントを独 ⾃のビジネスプロセスに合わせ ることができ、より正確な対応 と調整が可能になります。 - 重⼤インシデント、セキュリテ ィインシデントなど、さまざま なインシデントに対応するカス タム対応プロセスを推進できま す。 - 適切なプロセスに沿ってチーム が時間を節約し、対応中に重要 な⼿順の⾒落としを回避できる よう⽀援します ビジネスプロセスに 合わせて、インシデ ントを分類 Early Access: (w/ Slack, MS Teams, Mobile and Analytics support) GA: 2025年1⽉頃 (w/ ServiceNow ITSM and Analytics for Custom Fields)

Slide 17

Slide 17 text

Proprietary & Confidential パーソナライズされた推奨事項に より、運⽤成熟度を向上させるた めに最も効果的なアクションを迅 速に特定できます。 業界ベンチマークにより、お客様 のパフォーマンスが同様の企業と ⽐較してどの程度であるかを確認 できます。 これらの指標は連携して機能し、 改善が必要な領域を特定し、アク ションの優先順位付けを⽀援しま す。 Recommendations (GA) Benchmarks - GA 2025年1⽉頃 Recommendati ons & Benchmarking 運⽤改善につなが る実践的な提案

Slide 18

Slide 18 text

Benchmarks to drive operational maturity Operational maturity model

Slide 19

Slide 19 text

Innovations to scale & standardize automation PagerDuty Automation Use Case Library https://www.pagerduty.com/automation/

Slide 20

Slide 20 text

PagerDuty Resources PagerDuty クイックガイド(⽇本語) - 利⽤ガイド https://qiita.com/ymotomu/items/42f825accbfca287464a - 設定ガイド https://qiita.com/ymotomu/items/e6d13e5284a62e3a1100 PagerDuty 株式会社公式HP (無料トライアル申込み/導⼊事例/価格) https://www.pagerduty.co.jp/ PagerDuty 公式ユーザードキュメント https://support.pagerduty.com/lang-ja/docs Integration Guide (モニタリングツール‧コラボレーションツール等との連携⽅法) https://www.pagerduty.com/integrations/ インシデント対応プロセスのベストプラクティス (英語) https://response.pagerduty.com/ (有志のユーザー様による⽇本語翻訳版) 20

Slide 21

Slide 21 text

No content