Slide 28
Slide 28 text
標準化か?正規化か?
機械学習で行う主なスケーリング
標準化
データ全体を標準正規分布に
近似する手法
sklearn.preprocessing.StandardScaler
正規化
データ全体の最小値を最大値
を揃える手法
sklearn.preprocessing.MinMaxScaler
対数
変換
対数に変換する手法。金額や
カウント表す変数に適用
numpy.log
外れ値
に頑健
四分位範囲が1になるよう変換
する手法
sklearn.preprocessing.RobustScaler
参考文献
Python機械学習クックブック
Kaggleで勝つデータ分析の技術
上記以外にも多種多様な変換手法あり