Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DevOpsDays Taipei 2026 - Alert 分析進化史
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
MilesChou
June 26, 2026
Technology
4
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
DevOpsDays Taipei 2026 - Alert 分析進化史
Alert 分析進化史:從 Excel 到 AI Agent,6 個月的迭代與妥協
https://devopsdays.tw/2026/session/4767
MilesChou
June 26, 2026
More Decks by MilesChou
See All by MilesChou
DevOpsDays Taipei 2023 Trunk Based Development
mileschou
0
360
Other Decks in Technology
See All in Technology
Agile and AI Redmine Japan 2026
hiranabe
3
280
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
170
Chainlitで作るお手軽チャットUI
ynt0485
0
280
Lightning近況報告
kozy4324
0
190
2026 TECHFRESH 畢業分享會 - 開發日常大解密!從領域驅動到企業級上線
line_developers_tw
PRO
0
1.3k
【Cyber-sec+】経営層を"動かす"ための考え方
hssh2_bin
0
200
【2026年版】 ベクトル検索とEmbedding最前線
mocobeta
16
4.4k
AI駆動開発を通して感じた、 AI時代のデザイナーの役割変化
whisaiyo
4
2.3k
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
150
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
410
日本 Fintech 未来予測レポート 2027〜2028年(手動編集版)
8maki
1
2.5k
フィジカル版Github Onshapeの紹介
shiba_8ro
0
290
Featured
See All Featured
From π to Pie charts
rasagy
0
210
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
Technical Leadership for Architectural Decision Making
baasie
3
420
HDC tutorial
michielstock
2
720
Bash Introduction
62gerente
615
220k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
Building Adaptive Systems
keathley
44
3.1k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
210
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Utilizing Notion as your number one productivity tool
mfonobong
4
320
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
A Soul's Torment
seathinner
6
3k
Transcript
Alert 分析進化史 Miles @ 2026/6/26 DevOpsDays Taipei 2026 從 Excel
到 AI Agent,6 個 月 的迭代與妥協
https://github.com/MilesChou Miles PHP, Docker, DevOps
Outline • 講古聽故事 • AI Work fl ow 設計經驗分享
前情提要
前情提要 • 2024 以前,不同團隊的 Alert 是各 自 管理的 • 2024
完成了 Alert 集中服務,中央可控管觸發 水 位,團隊可在 Kibana 查 Log
前情提要 • 2024 以前,不同團隊的 Alert 是各 自 管理的 • 2024
完成了 Alert 集中服務,中央可控管觸發 水 位,團隊可在 Kibana 查 Log • 2025 專案延續,想出讓 Alert 可以不擾 民 的 方 法或機制
前情提要 開局就是 一 份 Excel
就來分析 Excel 吧
分析 Excel 資料 • 漏看 • 查很慢 • 只有對話資訊,沒有細節 •
跨團隊理解缺少必要知識
不然,來查 Kibana 好了
Kibana 分析 message Top N 使 用 Lens 的 Top
values
Kibana 分析 message Top N
Kibana 分析 message Top N
再來我該怎麼辦? • 定義 Alert Model,把 log 規範化 • 由團隊提供分類 方
法,直接 用 分類 方 法下 regex • 強制對所有訊息 group by + regex 分類 • 參考資訊 • 12,556 錯誤 / 1,673 種樣態
是時候展現出 AI 的實 力
AI 分析 Excel 資料 • 想請 AI 分類數百筆 alert,結果 AI
用 「它覺得的關鍵字」做表 面 比對 • 例如:timeout 一 律歸成「網路問題」,但其實可能是 db slow query • 最後 Excel 的資料是 人工 分類完的
AI 分析 Kibana 資料 • Kibana 有提供 API 可以下載 JSON
資料 • 本地有 JQ 可以 用
AI 分析 Kibana 資料 • Message Group by 後的資料(Random) •
服務 Alert 分布 • 時間區段 Alert 分布
AI 分析 Kibana 資料
GitHub Repo
GitHub Issues
GitHub Project
Teams
AI Work fl ow 設計
AI Work fl ow 設計 Overview
AI Work fl ow 設計 下載資料
AI Work fl ow 設計 單 日 統計報表流程
AI Work fl ow 設計 當 月 趨勢
AI Work fl ow 設計 根因分析 RCA
AI Work fl ow 設計 根因分析 RCA
AI Work fl ow 設計 跨團隊會議
AI Work fl ow 設計 洞察報告
AI Work fl ow 設計 Teams 通知
AI Work fl ow 設計 Teams 通知
AI Work fl ow 設計的經驗分享 • 固定執 行 的任務,比起 prompt,腳本才是最適合的
• Token 用 量更少 • 失誤率更低 • 白 名單更好設定
None
AI Work fl ow 設計的經驗分享 • 拆多個階段 • 每個階段的產出都可被檢核 •
第 一 個階段完成,第 二 個階段失敗不 用 全部重來 • metadata 是 JSON 格式,流程階段儲存在裡 面
AI Work fl ow 設計的踩雷經驗 • 不要 用 MCP, 用
JQ 就好 • 不要 用 Database, 用 JSONL 就好 • 不要任意調整開 issue 流程,是需要經過討論的
Skill 設計 • 78 個檔案 • 40% 執 行 任務
• 60% 教 AI 做事
Hannah Yang @ 5/28 DevOps Taiwan Meetup #78 「將標準整理清楚,AI 超好
用 」
最後,做了這麼多,有 用 嗎?
None
在沒有 AI 的時候 我們發 生 Alert 都怎麼處理?
None
人 覺得不好處理的,AI 通常也不好處理
如何 一 句話簡述主幹開發,我會說 「把程式寫好」
今天是聊 Alert,我會說 「把 Log 寫好」
事實上,把程式寫好、把 Log 寫好 都是在解決「 人 會遇到的問題」