Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2024/10 PagerDuty機能アップデート
Search
Kazuto Kusama
October 23, 2024
Technology
180
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
2024/10 PagerDuty機能アップデート
Kazuto Kusama
October 23, 2024
More Decks by Kazuto Kusama
See All by Kazuto Kusama
自宅LLMの話
jacopen
1
700
プラットフォームエンジニアリングはAI時代の開発者をどう救うのか
jacopen
9
5.4k
OpenClawで回す組織運営
jacopen
3
1.2k
SREの仕事を自動化する際にやっておきたい5つのポイント
jacopen
6
1.6k
AI時代のインシデント対応 〜時代を切り抜ける、組織アーキテクチャ〜
jacopen
4
400
AI時代の開発とPlatform Engineeringについて考える
jacopen
0
240
AI によってシステム障害が増える!? ~AI エージェント時代だからこそ必要な、インシデントとの向き合い方~
jacopen
4
410
インシデント対応に必要となるAIの利用パターンとPagerDutyの関係
jacopen
0
430
今日からはじめるプラットフォームエンジニアリング
jacopen
8
5.1k
Other Decks in Technology
See All in Technology
[AWS Summit Japan 2026]迷っているあなたへ_小さな一歩が、やがて自分を助けてくれる
sh_fk2
1
340
いまさら聞けない「仕様駆動開発入門」 〜AI活用時代の開発プロセスを考える〜
findy_eventslides
2
170
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
3
770
アジャイルな経理と Claude Code と経営の未来
kawaguti
PRO
3
180
Claude Codeをどのように キャッチアップしているか
oikon48
13
8.7k
AI 不只幫你寫 Code: 當專案從 300 暴增到 1500, 我們如何撐住 DevOps
appleboy
0
120
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
450
40代で“やっとエンジニアになれた”――閉じた学びを開き、空の青さを知る / 20260628 Naoki Takahashi
shift_evolve
PRO
4
500
GitHub Copilot 最新アップデート – 「一歩先」の実践活用術
moulongzhang
5
1.6k
螺旋型キャリアの生存戦略 / kinoko-conf2026
rakus_dev
1
680
AIチャット検索改善の3週間
kworkdev
PRO
2
160
感情と身体を置き去りにしない、エンジニアの生きのこり方 ──いまから、ここから「自分の状態」を扱うという選択
saorimurooka
0
190
Featured
See All Featured
Designing Powerful Visuals for Engaging Learning
tmiket
1
420
4 Signs Your Business is Dying
shpigford
187
22k
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
240
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
Ruling the World: When Life Gets Gamed
codingconduct
0
260
Test your architecture with Archunit
thirion
1
2.3k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
Site-Speed That Sticks
csswizardry
13
1.2k
Code Review Best Practice
trishagee
74
20k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
66
55k
Unsuck your backbone
ammeep
672
58k
Transcript
PagerDuty 機能アップデート 2024年10⽉
Agenda - PagerDuty Operations CouldとE2Eインシデント管理 - 機能アップデート - PD Advance:
⽇本語対応 + MS Teams対応 - Event Orchestration: External Data Variables - Dynamic EP & Service Reassignment - Alert Grouping: Global, Unified, and Enhanced pattern recognition - Incident Types - Operational Maturity: Top Recommendations & Benchmarks - Automation Use Case Library https://www.pagerduty.com/automation/
動員 解決 ⽂書化 緩和 学習 検知 トリアージ 「インシデント対応」から「E2Eインシデント管理」へ 動員 検知
監視ツールの 整理‧統合 担当者の通知 インシデント管理として、考慮すべきプロセス全体: 最初にテコ⼊れが検討されるプロセス: インシデントの特定 ⾃動処理 原因を素早く特定 関係者にリアルタイムで状況を共有 運⽤状況の可視化 運⽤プロセスの改善 検知と動員だけでは解決できない課題: • 担当者の負担増 • 解決までに時間がかかる • インシデント対応の可視化と改善 3
Automation Monitoring - On-prem DC ChatOps & Collaboration ITSM/Ticket管理 Code/Config
Management AI-Based Foundational Data Model PagerDuty Operations Cloud インシデント管理プロセスをEnd-to-Endで標準化 4 動員 解決 記録 緩和 学習 検知 トリアージ 改善 分析 Monitoring - Public Cloud Customer Service Security JP1 Senju Systemwalker Event-Driven Human-in- the-Loop エンドユーザー CEO/CIO/CTO カスタマーサービス 運⽤担当者 あらゆるツールから Eventを集約 - 700+ Integrations - Email 開発者 Status Page
PagerDuty Operations Cloud リファレンスアーキテクチャ
状況を教えて 以前の類似インシデントは どうやって解決した? 最近⾏った変更は? ⽇本語(GA)‧MS Teams(EA)のサポート
Event Orchestration: Variables利⽤したルー ルを評価‧実⾏ Proprietary & Confidential (Optional) Incident Workflow
からExternal Variableを更新 外部データ Event B Event A API Event Orchestration Rules (GA) Event Aに関する条件を元に、 Event Aの処理を実⾏ EO Variables (GA) Event Bに関する条件を元に、 Event Aの処理を実⾏ External Data Variables (EA) 任意の外部データに関する条件を 元に、Event Aの処理を実⾏ Event Orchestration Variables 他Eventや外部のデータを参照し、柔軟なEvent Ruleを作成
Dynamic Escalation Policy サービス構成を維持したまま、柔軟な通知先の制御を実現 Proprietary & Confidential 課題: Technical ServiceにEscalation
Policy が紐づいているため、同⼀Service内で 通知先メンバーを動的に変更すること が難しかった。 例) P1相当のインシデントは、通常のイ ンフラメンバーではなく、SREチームを 直接アサインしたい Dynamic EPによる解決: Event Orchestration Ruleで、動的にEP を変更できるように
Proprietary & Confidential 動的にインシデント のエスカレーション 先を変更 - イベントデータに基づいてエ スカレーションポリシーを動 的に割り当てることで、適切
な対応者に通知されるように - 組織内のインシデント対応を ⼀元管理 Dynamic Escalation Policies GA (Generally Available) AIOps only
Proprietary & Confidential - インシデントを扱うのに最 適なサービスに、インシデン トを再割り当て - 適切な専⾨家、データ、レ ポートが割り当てられること
で、対応をスムーズに - ServiceNowなどのITSMツ ールとの双⽅向同期を強化し 、チケットとPagerDutyイン シデント間でサービス変更を 整合させます Service Reassignment 正しいサービスに インシデントを移動 EA (Early Access) - 2025年1⽉ 頃
Service 2 Service 1 Service 2 Service 1 Proprietary &
Confidential Alert Groupingの進化 Groupingの範囲拡⼤と精度向上 Incident A Incident B Incident A Global Alert Grouping 従来のAlert Grouping Unified Alert Grouping: Intelligent (ML) と Content-Based を組み合わせて利⽤可能に Enhanced Pattern Recognition: MLのパターン判定に利⽤するフィールドの拡⼤‧カスタマイズ 件名 (アラートのタイトル) → 最⼤5つまで任意のフィールドを指定可能に
Proprietary & Confidential サービスをまたいで アラートをグループ化 し、ノイズを削減 - 複数のサービスにわたるア ラートのグループ化により、 ノイズ削減を効率化
- MLによるIntelligentモード またはコンテンツベースのア ラートグループ化を利⽤ Global Alert Grouping Intelligent/Content (GA) Unified (EA) AIOps only
Proprietary & Confidential 2つのグルーピング モードを併⽤し、 ノイズ削減の精度 を向上 - インテリジェント(ML)モードと コンテンツベースのアラートグ
ループ化を組み合わせ得ること で、最⼤限のグルーピングの精 度を向上 - コンテンツベースのルールを作 成することで、MLによるグルー ピングを⾏う対象を制限します Single Service (GA) Global (EA) AIOps only Unified Alert Grouping
Proprietary & Confidential MLに追加のメタデー タを適⽤し、グルーピ ング精度を向上 - アラートの類似性を判断する ためのFieldを追加指定すること が可能に
- アラートのタイトルを変更す ることなく、グルーピングの精 度を向上 Enhanced Pattern Recognition EA GA 2025年1⽉頃 AIOps only
Proprietary & Confidential Incident Types インシデントの種類を定義し、利⽤するCustom FieldsやIWを変更 Incident Typeに合わせて制御でき る項⽬:
- Custom Fields - Incident Workflows - ChatOps - Status Update Notifications - ServiceNow - Analytics インシデントの重⼤度 担当部署/サービス インシデントの種類 Base Incident Major Incident Security FinOps App A App B
Proprietary & Confidential Incident Types - PagerDutyのインシデントを独 ⾃のビジネスプロセスに合わせ ることができ、より正確な対応 と調整が可能になります。
- 重⼤インシデント、セキュリテ ィインシデントなど、さまざま なインシデントに対応するカス タム対応プロセスを推進できま す。 - 適切なプロセスに沿ってチーム が時間を節約し、対応中に重要 な⼿順の⾒落としを回避できる よう⽀援します ビジネスプロセスに 合わせて、インシデ ントを分類 Early Access: (w/ Slack, MS Teams, Mobile and Analytics support) GA: 2025年1⽉頃 (w/ ServiceNow ITSM and Analytics for Custom Fields)
Proprietary & Confidential パーソナライズされた推奨事項に より、運⽤成熟度を向上させるた めに最も効果的なアクションを迅 速に特定できます。 業界ベンチマークにより、お客様 のパフォーマンスが同様の企業と ⽐較してどの程度であるかを確認
できます。 これらの指標は連携して機能し、 改善が必要な領域を特定し、アク ションの優先順位付けを⽀援しま す。 Recommendations (GA) Benchmarks - GA 2025年1⽉頃 Recommendati ons & Benchmarking 運⽤改善につなが る実践的な提案
Benchmarks to drive operational maturity Operational maturity model
Innovations to scale & standardize automation PagerDuty Automation Use Case
Library https://www.pagerduty.com/automation/
PagerDuty Resources PagerDuty クイックガイド(⽇本語) - 利⽤ガイド https://qiita.com/ymotomu/items/42f825accbfca287464a - 設定ガイド https://qiita.com/ymotomu/items/e6d13e5284a62e3a1100
PagerDuty 株式会社公式HP (無料トライアル申込み/導⼊事例/価格) https://www.pagerduty.co.jp/ PagerDuty 公式ユーザードキュメント https://support.pagerduty.com/lang-ja/docs Integration Guide (モニタリングツール‧コラボレーションツール等との連携⽅法) https://www.pagerduty.com/integrations/ インシデント対応プロセスのベストプラクティス (英語) https://response.pagerduty.com/ (有志のユーザー様による⽇本語翻訳版) 20
None