游騰林 TENG-LIN YU | Mail:
[email protected]
NCCU - 資料視覺化工作坊
離群值處理
• 到底該不該清掉離群值?
• 離群值的進行方式
• 截尾
• Log2, 10, e,…
• 1.5 * IQR
• 9 * MAE
• 3 * std
• 混合: Domain + 1.5*IQR
• 樣本數
• Training: 8,067 > 7,225
• Testing: 2,017 > 1,826
65
IQR*1.5 是常用的數值,可以再依需求調大/小