資料煉金術師:一場關於 LINE 電商煉金的故事
by
LINE Developers Taiwan
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
資料煉⾦術師
Slide 2
Slide 2 text
01 02 02 推薦系統 資料科學家、機器學習工程師、資料工程師 電商鍊成陣 國家鍊⾦術師 真的有賢者之石嗎? 我所看到的真理 Agenda
Slide 3
Slide 3 text
Vila Lin 電商資料⼯程經理 • 學歷: 清⼤⽣資 MS • 領域: 機器學習、類神經網路、⽣物統計 、演算法設計與分析
Slide 4
Slide 4 text
SECTION 01 電商鍊成陣 推薦系統
Slide 5
Slide 5 text
推薦 in LINE 錢包 左: LINE 禮物個⼈化品牌推薦 右: LINE 個⼈化類別推薦
Slide 6
Slide 6 text
推薦 in LINE 購物 個⼈化品牌商品 個⼈化店家 熱銷⾦榜 低價商品 今⽇熱搜字
Slide 7
Slide 7 text
SECTION 02 資料⼯程師、機器學習⼯程師、資料科學家 國家鍊⾦術師
Slide 8
Slide 8 text
電商鍊⾦術師 資料 分析師 軟體 ⼯程師 DevOps ⼯程師 商業面向 工程面向
Slide 9
Slide 9 text
電商鍊⾦術師 資料科學家 機器學習工程師 資料工程師 研究 ML/AI 進階分析 研究 ML/AI 進階分析 模型/演算法/參數最佳化 開發 ML 流程 軟體工程 設計模式 分散式架構
Slide 10
Slide 10 text
鍊⾦術師的戰⾾位置 資料科學家 資料工程師 機器學習工程師 ML Ops 陣線 資料分析 & 挑選 資料收集 & 清洗 建模 驗證 推論 部署
Slide 11
Slide 11 text
鍊⾦術師的技能 資料庫 資料工具與平台 天橋下的說書人 資料視覺化 商業洞察 成效指標 假設與實驗 模型推論 統計與 ML 建模 模型佈建 資料流 ML Ops
Slide 12
Slide 12 text
資料⼯程師 資料流 資料庫 資料⼯具與平台 ML Ops 資料⼯程師的主線技能
Slide 13
Slide 13 text
資料科學家 統計與 ML 建模 推論 假設與實驗 成效評估 資料科學家的主線技能 A/B Testing Hit Rate F1 Score CTR
Slide 14
Slide 14 text
關於模型
Slide 15
Slide 15 text
關於模型 雙塔模型 (推薦系統) BERT (NLP) CNN (影像/語音辨識)
Slide 16
Slide 16 text
機器學習⼯程師 ML Ops 模型佈建 統計與 ML 建模 模型推論 機器學習⼯程師的主線技能
Slide 17
Slide 17 text
SECTION 03 真的有賢者之⽯嗎? 我所看到的真理
Slide 18
Slide 18 text
沒有賢者之⽯ 任何演算法/模型都有適⽤場景 (LLM 的 fine-tune其實也是滿滿領域知識) 遇到困難⼤家持續溝通和討論 找出 dev 與 po 都可以接受的⽅案
Slide 19
Slide 19 text
不要被數字騙了 模型成效過好其實很可疑 記得回過頭確認資料集是否有問題 免得上線引入真實資料的模型⼤失所望
Slide 20
Slide 20 text
數學很重要 • 資料⼯程師: 資料確保 (判讀統計趨勢找問題) • 資料科學家: 統計分析、模型驗證、 A/B 測試 • 機器學習⼯程師: 特徵⼯程、實作演算法或模型
Slide 21
Slide 21 text
No content
Slide 22
Slide 22 text
No content
Slide 23
Slide 23 text
No content