- 初めてPagerDutyを利用する方へ、操作方法などのガイドを準備
- 参考にするなら「PagerDuty利用ガイド - Responder編」がおすすめ
o PagerDutyの山田さん執筆
MTTAを短縮する仕組みの民主化(2):PagerDutyの基本機能
https://qiita.com/ymotomu/items/42f825accbfca287464a
Slide 33
Slide 33 text
MTTAを短縮する仕組みの民主化(3):モニタリングツールとの連携
「サービス」
「インテグレーション」
「Dynamic Notifications」
X
X
Slide 34
Slide 34 text
- PagerDutyへは主にNew RelicとAzure Monitor alertから通知
o 700以上ある「インテグレーション」に上記2つも当然対応
- 特にNew Relicの導入と展開によって各チームでアラート管理も可能に
o 参考:Future Stack Tokyo 2023「イオンのデジタルシフト戦略を支える New Relicプ
ラットフォームの導入と効果」(再掲)
MTTAを短縮する仕組みの民主化(3):モニタリングツールとの連携
Slide 35
Slide 35 text
- 「Dynamic Notifications」はNew RelicやAzure Monitor alertから
PagerDutyへ通知した際のSeverityを動的に判断してHighかLowかを判定する
大変便利な機能
o Highなら電話
o Lowなら通知だけ
▪ といった運用が簡単にできる
- 複雑なら「Event Orchestration」を検討
MTTAを短縮する仕組みの民主化(3):モニタリングツールとの連携
Slide 36
Slide 36 text
New RelicとPagerDutyのアカウントさえあ
れば、各チームで簡単に迅速なアラートを作
成し、その通知をコントロールできる
MTTAを短縮する仕組みの民主化(4):まとめ
Slide 37
Slide 37 text
PagerDutyアカウントの民主化
Slide 38
Slide 38 text
- PagerDutyのユーザは以下の2種類がある
o Full Users: PagerDutyを利用する基本のユーザ
o Stakeholder Users: オンコールは担当しない、状況を確認する向けユーザ
PagerDutyアカウントの民主化(1):ユーザの種類
現在はFull Usersのみを利用
- 「Assistant for Slack(旧名PagerDuty Copilot)」をベータで検証
- インシデントのノートの活用でかなり正確な概要を回答してくれた
AIOpsによる障害対応サポート(2):Assistant for Slack
Slide 45
Slide 45 text
• 前半でも紹介した「どうなってるんだ」と定期的なポーリングへの1つの回答になる
AIOpsによる障害対応サポート(2):Assistant for Slack
Slide 46
Slide 46 text
• 過去の類似インシデントを提案してくれる機能は、障害対応経験豊富な猛者が
行う「あの時の障害と似てない?」をAIが代行してくれる
AIOpsによる障害対応サポート(2):Assistant for Slack
Slide 47
Slide 47 text
• 類似インシデントは表示も見やすい(いつ、何件、発生期間)
AIOpsによる障害対応サポート(2):Assistant for Slack
Slide 48
Slide 48 text
• イオンスマートテクノロジーとしては"Slack"の利用があるが、関連するイオン
グループ企業の標準のチャットツールは"Slack"ではなく"Teams"...
AIOpsによる障害対応サポート(2):Assistant for Slack
「PagerDuty Assistant for Teams」
もお待ちしております!!!!
※ (Support for Microsoft Teams coming soon.)の記述あり
https://www.pagerduty.com/blog/pagerduty-advance-genai-features-for-the-pagerduty-operations-cloud/