Slide 1

Slide 1 text

葬送的通靈師: 化系統與用戶雜訊 成行動訊號

Slide 2

Slide 2 text

LINE TODAY DATA | TECH FRESH Education: • B.A. Global Business @ AIU, Japan • Exchange, Information Systems @ UNSW, Australia Experience: • Data Scientist Intern @ EY AI Lab • ML Engineer Intern @ LINE TODAY DATA Audrey Chang

Slide 3

Slide 3 text

01 02 03 04 從看新聞,到參與討論 互動變多,雜訊也會變多 從貼文行為,到異常群體偵測 by Audrey 為什麼需要偵測? 怎麼把行為變成訊號? 解放工程師的Debug Time by Yuki AI Debug Agent 討論牆是什麼? 05 Beyond LINE Work CONTENT

Slide 4

Slide 4 text

從看新聞,到參與討論 01 討論牆是什麼?

Slide 5

Slide 5 text

大量內容和使用者聚在一起, 自然會冒出一個需求—— 「大家看完之後,想不想討論?」 看內容 → 參與討論 LINE TODAY不只是看新聞

Slide 6

Slide 6 text

看到新聞或話題 從一篇內容開始 → 發表看法 / 回覆 按下「建立貼文」 → 互動與擴散 更多人加入討論 討論牆:LINE TODAY的討論入口

Slide 7

Slide 7 text

互動變多,雜訊也會變多 02 為什麼需要偵測?

Slide 8

Slide 8 text

洗版 / 廣告 重複留言、夾帶廣告 集中操作帶風向 多帳號同步鎖定同一內容 討論品質下降 正常討論被壓掉 使用者體驗劣化 我們的目標:不是審查內容,而是觀察行為是否自然 只要能發文,就會出現風險

Slide 9

Slide 9 text

正常貼文 vs 異常貼文

Slide 10

Slide 10 text

正常討論 異常同步操作 文章 A 文章 B 文章 C 時間 t 10:10 10:25 10:40 時間分散 目標分散 文章 X 時間 t 10:10 10:20 10:30 同一時間窗 同一內容 時間集中 目標一致 每個點=一次貼文行為;顏色=不同帳號 貼文背後:「時間 × 目標內容」的行為模式 正常討論 vs 異常同步操作

Slide 11

Slide 11 text

C Coordinated 協同 一群帳號一起行動 I Inauthentic 造假 假裝是互不相識的真人 B Behavior 行為 看行為模式,不是看內容 一群帳號裝成不同人,在同一指揮下集體行動 什麼是CIB?

Slide 12

Slide 12 text

從貼文行為,到異常群體偵測 03 怎麼把行為變成 訊號?

Slide 13

Slide 13 text

STEP1 帳號配對 兩個帳號是不是常常一起出現? 觀察:A 和 B 反覆一起出現 → 配對訊號 Pair signal A B 共同出現次數 + 相似度 一起一次可能是巧合;反覆一起出現,才是訊號 時間 帳號 內容 10:11 A 文章 1 10:12 B 文章 1 10:13 C 文章 2 10:15 A 文章 3 10:16 B 文章 3 貼文行為 → 帳號配對 → 群體偵測 → 行為追蹤

Slide 14

Slide 14 text

貼文行為 → 帳號配對 → 群體偵測 → 行為追蹤 關注單位:兩個帳號 → 一群帳號 可疑群體 A 可疑群體 B 1 2 5 6 從 pair 到 group:把零散關係串成群體模式 STEP 2 群體偵測 把配對連成網路,浮出一群人 3 4 7 8 Strong intra-community edges Strong intra-community edges

Slide 15

Slide 15 text

貼文行為 → 帳號配對 → 群體偵測 → 行為追蹤 過去樣態 可疑成員清單 歷史行為關係 → 今天 新的貼文行為 新的互動紀錄 → 偵測規則 同群體 + 同內容 + 相近時間窗 → 提醒 請人工複查 一次分析 → 持續偵測訊號 STEP 3 行為追蹤 每天比對:這群人今天又一起動了嗎?

Slide 16

Slide 16 text

AI 時代下 Data Team 的核心價值 化用戶雜訊為行動訊號 同一個現象,可能是正常熱門... 短時間內大量貼文:重大新聞引發自然 討論,屬於產品正常增長現象 ◈ 也可能是同步操作(CIB) 特定帳號組合在相近時間窗、針對相同 目標過度一致的異常行為模式 ⌕ 01 問對問題 Define: 先定義什麼現象值 得被偵測,確保開發資源精 準投入在關鍵風險上 ∞ 02 補對脈絡 Context: 透過時間、帳號 關係與產品情境,讓數據 背後有理由,建立模型可 信度 03 接進流程 Action: 讓偵測結果不再只是 Notebook 裡的圖表,而是 能讓下游系統行動的訊號

Slide 17

Slide 17 text

··· 可解釋性的價值 解釋「為什麼異常」, 比給出模型分數更重 要。這是讓訊號落地 的關鍵 EXPLAINABLE AI ⌗ 規模化即是挑戰 面對千萬級用戶,演 算法的效能與偵測準 確率之間取得平衡, 是工程實踐的核心 HIGH THROUGHPUT ↻ 持續進化的閉環 建立「人機協調」反 饋機制,從誤報中學 習,應對不斷變化的 威脅 ADVERSARIAL THINKING 數據之外 MLE 的實踐思維與隱形挑戰

Slide 18

Slide 18 text

解放工程師的Debug Time by Yuki 04 AI Debug Agent

Slide 19

Slide 19 text

Yuki Lin LINE EC DEV | TECH FRESH Education: • M.S. CS @ NYCU, Taiwan Experience: • Tech Fresh @ LINE • Scholarship Recipient @ Garmin • Engineering Intern @ ITRI • Engineering Intern & RA @ Academia Sinica IIS

Slide 20

Slide 20 text

SECTION 4.1 學術與企業的差異 系統架構的轉型與挑戰

Slide 21

Slide 21 text

學校專案 (School Projects) ● 功能少 架構單純 ● 基礎Git版本控制 ● 開發迭代少 ● 工程挑戰低: 設計與開發銜接簡單 企業環境 (LINE Enterprise) ● 多功能集成 重視風險 ● 複雜CI/CD流程與即時偵測 ● 開發迭代多 團隊合作緊密 ● 工程挑戰高: 跨系統排查&通過壓力測試 VS

Slide 22

Slide 22 text

SECTION 4.2 產品功能多樣 LINE 購物

Slide 23

Slide 23 text

導購系統 賺點數 額外優惠 賣家廣告機會 雙向獲利

Slide 24

Slide 24 text

No content

Slide 25

Slide 25 text

No content

Slide 26

Slide 26 text

No content

Slide 27

Slide 27 text

No content

Slide 28

Slide 28 text

No content

Slide 29

Slide 29 text

產品功能多樣 需更加重視風險

Slide 30

Slide 30 text

SECTION 4.3 網頁 VS APP & 前端 VS 後端 底層設計與除錯困難

Slide 31

Slide 31 text

WEB VS APP 你看得出來差別嗎?

Slide 32

Slide 32 text

高度一致的體驗,截然不同的底層排查 App Native 層: 專屬底層設計,需考量設備差異。 WebView 容器: 底層共用,可直接回歸 Web 端邏輯處理。

Slide 33

Slide 33 text

Backend Service (API Timeout / HTTP 500) Frontend Service (UI element lost)

Slide 34

Slide 34 text

為什麼需要 AI Debug Agent? 從「大海找問題」進化到「解決問題方向」 將繁瑣的排查時間從「小時級」壓縮至「分秒級」 化繁為簡: 運用 AI 自動過濾巨量雜訊,只提取與 Exception / Non-200 等相關的關鍵日誌。 經驗傳承: 模擬資深工程師的判斷邏輯,結合進 AI Work Flow中。 解放生產力: 讓開發團隊不再被例行性報錯綁架,專注於更有價值的功能開發與優化。

Slide 35

Slide 35 text

SECTION 4.4 解放工程師的Debug Time AI Debug Agent

Slide 36

Slide 36 text

AI Debug Agent 架構 CI/CD 環境 CI 測試失敗 Trigger 資料收集層 擷取原始產物 Capture 日誌精煉層 過濾與特徵擷取 Log Refining AI 推理層 根因分析與推論 AI Analysis 通知與反饋層 產出行動建議 Notification

Slide 37

Slide 37 text

CI/CD 環境 CI 測試失敗 Trigger 資料收集層 擷取原始產物 Capture 日誌精煉層 過濾與特徵擷取 Log Refining AI Debug Agent 架構 Over 100GB Report: • Allure Report • Cypress status

Slide 38

Slide 38 text

結構化 JSON ● 關鍵Error 資訊 ● 相關數據 CI/CD 環境 CI 測試失敗 Trigger 資料收集層 擷取原始產物 Capture 日誌精煉層 過濾與特徵擷取 Log Refining AI 推理層 根因分析與推論 AI Analysis AI Debug Agent 架構 Over 100GB Report: • Allure Report • Cypress status ⚫ 獨立Container ⚫ 動態過濾: ➢ 無關檔案 ➢ Regex去除重複與無關資料 ⚫ 特徵提取關鍵錯誤內容 ⚫ 上下文壓縮與批次封裝

Slide 39

Slide 39 text

Work Flow SOP 自架MCP 料收集層 取原始產物 apture 日誌精煉層 過濾與特徵擷取 Log Refining AI 推理層 根因分析與推論 AI Analysis 通知與反饋層 產出行動建議 Notification AI Debug Agent 架構 Tools and Resources: ⚫ Wiki 確認Error與Feature資訊 ⚫ Slack查詢過去討論紀錄 ⚫ DB確認資料訊息 ⚫ Code & Debug (True Bug or Only Change) Local LLM (Client AI Agent)

Slide 40

Slide 40 text

結構化 JSON ● 關鍵Error 資訊 ● 相關數據 Work Flow SOP Result Report ● 根因摘要 ● Debug 建議 CI/CD 環境 資料收集層 擷取原始產物 Capture 日誌精煉層 過濾與特徵擷取 Log Refining AI 推理層 根因分析與推論 AI Analysis 通知與反饋層 產出行動建議 Notification AI Debug Agent 架構 Local LLM (Client AI Agent)

Slide 41

Slide 41 text

Result Report ● 根因摘要 ● Debug 建議 日誌精煉層 過濾與特徵擷取 Log Refining AI 推理層 根因分析與推論 AI Analysis 通知與反饋層 產出行動建議 Notification AI Debug Agent 架構

Slide 42

Slide 42 text

AI Debug Agent 架構 CI/CD 環境 CI 測試失敗 Trigger 資料收集層 擷取原始產物 Capture 日誌精煉層 過濾與特徵擷取 Log Refining AI 推理層 根因分析與推論 AI Analysis 通知與反饋層 產出行動建議 Notification 善用AI解放工程師的Debug Time

Slide 43

Slide 43 text

05 Beyond LINE Work

Slide 44

Slide 44 text

Development CI/CD & Observability New Tech Research TECH FRESH 工作日常 開發與優化 自動化與監控 研究與分享

Slide 45

Slide 45 text

溝通能力 對齊認知 解決問題 精準定位 學習能力 持續迭代 技術經驗 創造價值 我們的收穫 不僅僅是技術經驗而已

Slide 46

Slide 46 text

Work Life Balance

Slide 47

Slide 47 text

Work Life Balance

Slide 48

Slide 48 text

No content