Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2026TECHFRESH畢業分享會 - Lightning Talk - E起 See S...

2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算

Avatar for LINE Developers Taiwan

LINE Developers Taiwan PRO

June 17, 2026

More Decks by LINE Developers Taiwan

Other Decks in Technology

Transcript

  1. 職能介紹 Data Scientist 4 Data Engineer Machine Learning Engineer •

    ML Theory, Algorithm • Data Analysis • Data Pipeline • Database • Platform • Model Implementation • Tuning • MLOps
  2. Data Extraction Extract raw event logs from Hive tables 推薦架構

    7 Feature Engineering Model Training Generation Preparing user-side behavioral features and item-side features Train embeddings with Two-Tower architecture Orchestrate DAG pipelines for personalized & trending inference
  3. 離線 v.s. 線上評估 8 • 環境:使用歷史數據 • 目的:在模型上線前,驗證模型對於已知用戶 行為的預測能力 •

    優勢:迭代速度快、不會影響實際用戶 • 缺點:缺乏商業指標、與真實環境存在差距 • 環境:真實環境 • 目的:衡量推薦系統對業務指標(如點擊率 、轉換率)的實際貢獻 • 優點:反映真實商業價值、捕捉動態反饋 • 缺點:時間與工程成本高、具備業務風險、 易受外在因素干擾 離線評估 (Offline Evaluation) 線上評估 (Online Evaluation)
  4. 離線評估指標 9 公式 意義 Precision@10 前 10 筆命中數 / 10

    推薦前 10 筆中「命中」的比例 Recall@10 前 10 筆命中數 / 該用戶 label 總數 所有喜好商品中,前 10 筆能抓到幾個 MAP AP = Σ(P@i × rel(i)) / |labels|, 再取用戶平均 考慮命中位置的加權 Precision,越靠前的命中 越加分 NDCG@10 DCG@10 / IDCG@10, DCG = Σ rel(i)/log₂(i+1) 位置折扣累積增益,命中越靠前分數越高,以 理想排序做歸一化 MRR 1/rank(第一個命中) 取用戶平均 第一個推薦命中的排名越前越好;只看「有沒 有猜到最重要的一個」