Slide 1
Slide 1 text
• 特徵工程是在建置數據模型時相當重要也最藝術的部分,能
幫助模型捕捉解釋變數和目標變數間的聯繫。而藝術的地方
在於進行特徵工程相當大程度取決於研究者對於領域知識、
專案需求的理解,沒有一體適用的方法
• 在這次的演講中我將以 CakeResume 上的職缺資料為例,
和大家分享我建置的薪資預測模型,以及如何經過一系列的
特徵工程後,將模型的效度(R^2) 從原本的 0.06 逐步提升
至 0.51
• 要強調這次分享的重點並不在於模型的效度本身,而是該如
何反覆分析與診斷模型的問題,有目的性的根據遇到的問題
來進行對應的特徵工程,讓模型效度能滿足業務端的需求
Sciwork 2023 December 9-10
Mastering Feature Engineering:
Mining the Hidden Salary Formula with CakeResume
#Python #薪資預測 #特徵工程
游騰林(tlyu0419)
騰林是國泰數據部的資料科學家,擅長透過
Python, R 建置機器學習/深度學習模型、網路
爬蟲、資料視覺化以及圖形演算法
Speaker of PyCon, PyData, AIAcademic,
MOPCON, COSCUP, Sciwork conference