Slide 1

Slide 1 text

E 起 See See: 電商推薦讀心術? 數據說了算! LINE EC Data Intern, Jenaya Lin

Slide 2

Slide 2 text

01 02 03 推薦版位與推薦架構 推薦結果分析 團隊介紹 CONTENT

Slide 3

Slide 3 text

Jenaya Lin LINE TechFresh EC Data Team Master's Student, NCCU MIS

Slide 4

Slide 4 text

職能介紹 Data Scientist 4 Data Engineer Machine Learning Engineer • ML Theory, Algorithm • Data Analysis • Data Pipeline • Database • Platform • Model Implementation • Tuning • MLOps

Slide 5

Slide 5 text

可以在這邊 找到我們! EC 5

Slide 6

Slide 6 text

推薦 版位 商店推薦 6 商品推薦 文章推薦

Slide 7

Slide 7 text

Data Extraction Extract raw event logs from Hive tables 推薦架構 7 Feature Engineering Model Training Generation Preparing user-side behavioral features and item-side features Train embeddings with Two-Tower architecture Orchestrate DAG pipelines for personalized & trending inference

Slide 8

Slide 8 text

離線 v.s. 線上評估 8 • 環境:使用歷史數據 • 目的:在模型上線前,驗證模型對於已知用戶 行為的預測能力 • 優勢:迭代速度快、不會影響實際用戶 • 缺點:缺乏商業指標、與真實環境存在差距 • 環境:真實環境 • 目的:衡量推薦系統對業務指標(如點擊率 、轉換率)的實際貢獻 • 優點:反映真實商業價值、捕捉動態反饋 • 缺點:時間與工程成本高、具備業務風險、 易受外在因素干擾 離線評估 (Offline Evaluation) 線上評估 (Online Evaluation)

Slide 9

Slide 9 text

離線評估 線上與離線評估比較圖 - 檢驗兩者趨勢是否相同 1 2 除 5/7 外,線上與 離線評估趨勢一致

Slide 10

Slide 10 text

離線評估指標 9 公式 意義 Precision@10 前 10 筆命中數 / 10 推薦前 10 筆中「命中」的比例 Recall@10 前 10 筆命中數 / 該用戶 label 總數 所有喜好商品中,前 10 筆能抓到幾個 MAP AP = Σ(P@i × rel(i)) / |labels|, 再取用戶平均 考慮命中位置的加權 Precision,越靠前的命中 越加分 NDCG@10 DCG@10 / IDCG@10, DCG = Σ rel(i)/log₂(i+1) 位置折扣累積增益,命中越靠前分數越高,以 理想排序做歸一化 MRR 1/rank(第一個命中) 取用戶平均 第一個推薦命中的排名越前越好;只看「有沒 有猜到最重要的一個」

Slide 11

Slide 11 text

離線評估 商品推薦 - 七天內各項指標個人化與流行推薦 1 0 個人化推薦很成功/ 消費者的需求明確 且分散

Slide 12

Slide 12 text

離線評估 商店推薦 - 七天內各項指標個人化與流行推薦 1 1 個人化推薦仍有進步 空間/用戶話題集中

Slide 13

Slide 13 text

實習心得

Slide 14

Slide 14 text

LinkedIn: jenaya-lin