Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLM 商品規格萃取大冒險- Vila
Search
LINE Developers Taiwan
PRO
October 20, 2025
0
1
LLM 商品規格萃取大冒險- Vila
LINE Developers Taiwan
PRO
October 20, 2025
Tweet
Share
More Decks by LINE Developers Taiwan
See All by LINE Developers Taiwan
Playwright/MCP/AI -Winter
line_developers_tw
PRO
0
0
LINE EC Product Catalog Development- Rei
line_developers_tw
PRO
0
2
LINE 與 AI 機器人技術應用現況
line_developers_tw
PRO
0
6
QA Testing
line_developers_tw
PRO
0
1
jcconf_datadev_prod
line_developers_tw
PRO
0
7
jcconf_SPM_prod
line_developers_tw
PRO
0
3
jcconf_LINEPay_prod
line_developers_tw
PRO
0
4
Live Activities in LINE
line_developers_tw
PRO
0
13
Neumorphism x Liquid Glass
line_developers_tw
PRO
0
12
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
514
110k
The Straight Up "How To Draw Better" Workshop
denniskardys
238
140k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
The Power of CSS Pseudo Elements
geoffreycrofte
79
6k
jQuery: Nuts, Bolts and Bling
dougneiner
65
7.9k
BBQ
matthewcrist
89
9.8k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Navigating Team Friction
lara
190
15k
Automating Front-end Workflow
addyosmani
1371
200k
The Language of Interfaces
destraynor
162
25k
Transcript
LLM 商品規格萃取大冒險 EC Data Lead Vila Lin
01 02 03 04 習得 LLM 魔法 實戰訓練場 寶藏與傳承 序章
CONTENT
01 序章
冒險的招喚 勇敢的資料工程團隊: LINE購物王國正面臨前所未有的挑戰 2000萬件商品資料如迷宮般混亂 消費者無法找到心儀的寶物... 運用魔法,將混沌化為秩序!
現況 商品繁多 維運耗時 廠商多元 商品多樣 非結構化 不易使用
混沌迷宮 傳統規則式 • 規則式維運 => 打地鼠 • 對新品與長尾商品不友善 • 仰賴商家回拋結構化資料
期望與挑戰 • 準確性 • 擴充性 • 成本控管
02 習得 LLM 魔法
構築魔法陣 資料搜集 資料清洗 規格萃取 後處理 驗證評估 生產環境
淨化試煉 • 字元與格式統一 • 抑制結構性雜訊 • 極端樣本處理 • 可觀測性
詠唱學院 • 來源與規格雙層優先序 • 同義異詞擴展 • 福利品/整新品/整修品 • 導入法遵強約束「負向規則」 •
範例驅動
附魔工坊 • 欄位契約與驗證 • 多值拆解 • 單位標準化 • 品牌同義字歸一化
03 實戰訓練場
資源管理所 • Airflow 搭配 Spark • GPT-4o mini • 批次與增量處理
守望者之塔 • 定時異常檢查並即時告警 • 雙重驗證閉環 • Prompt 系統化管理
勝利殿堂 • 準確率:95% • 累積規格:2000 萬+ • 日處理量:120 萬筆 •
成本降低:90%
04 寶藏傳承
智慧聖殿 系統化 品質 驗證 持續 迭代
智慧聖殿 過度相信 LLM 不做 資料清洗 只有 唯一方案
None