Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DevOpsDays Taipei 2026 - Alert 分析進化史

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.

DevOpsDays Taipei 2026 - Alert 分析進化史

Alert 分析進化史:從 Excel 到 AI Agent,6 個月的迭代與妥協

https://devopsdays.tw/2026/session/4767

Avatar for MilesChou

MilesChou

June 26, 2026

More Decks by MilesChou

Other Decks in Technology

Transcript

  1. 前情提要 • 2024 以前,不同團隊的 Alert 是各 自 管理的 • 2024

    完成了 Alert 集中服務,中央可控管觸發 水 位,團隊可在 Kibana 查 Log
  2. 前情提要 • 2024 以前,不同團隊的 Alert 是各 自 管理的 • 2024

    完成了 Alert 集中服務,中央可控管觸發 水 位,團隊可在 Kibana 查 Log • 2025 專案延續,想出讓 Alert 可以不擾 民 的 方 法或機制
  3. 再來我該怎麼辦? • 定義 Alert Model,把 log 規範化 • 由團隊提供分類 方

    法,直接 用 分類 方 法下 regex • 強制對所有訊息 group by + regex 分類 • 參考資訊 • 12,556 錯誤 / 1,673 種樣態
  4. AI 分析 Excel 資料 • 想請 AI 分類數百筆 alert,結果 AI

    用 「它覺得的關鍵字」做表 面 比對 • 例如:timeout 一 律歸成「網路問題」,但其實可能是 db slow query • 最後 Excel 的資料是 人工 分類完的
  5. AI 分析 Kibana 資料 • Message Group by 後的資料(Random) •

    服務 Alert 分布 • 時間區段 Alert 分布
  6. AI Work fl ow 設計的經驗分享 • 固定執 行 的任務,比起 prompt,腳本才是最適合的

    • Token 用 量更少 • 失誤率更低 • 白 名單更好設定
  7. AI Work fl ow 設計的經驗分享 • 拆多個階段 • 每個階段的產出都可被檢核 •

    第 一 個階段完成,第 二 個階段失敗不 用 全部重來 • metadata 是 JSON 格式,流程階段儲存在裡 面
  8. AI Work fl ow 設計的踩雷經驗 • 不要 用 MCP, 用

    JQ 就好 • 不要 用 Database, 用 JSONL 就好 • 不要任意調整開 issue 流程,是需要經過討論的