Slide 29
Slide 29 text
(補足)ダミー変数化
df = df.replace({'distance': [1000, 1200, 1400, 1500]}, 'sprint')
df = df.replace({'distance': [1600, 1700, 1800]}, 'mile')
df = df.replace({'distance': [2000, 2200, 2300, 2400]}, 'middle')
df = df.replace({'distance': [2500, 2600, 3000, 3200, 3400, 3600]}, 'stayer')
df = df.replace({'pre_distance': [1000, 1200, 1400, 1500]}, 'sprint')
df = df.replace({'pre_distance': [1600, 1700, 1800]}, 'mile')
df = df.replace({'pre_distance': [2000, 2200, 2300, 2400]}, 'middle')
df = df.replace({'pre_distance': [2500, 2600, 3000, 3200, 3400, 3600]},
'stayer')
columns_list = ['place', 'class', 'turf', 'weather', 'distance',
'condition', 'sex', 'pre_place', 'pre_turf', 'pre_distance']
df = pd.get_dummies(df, columns=columns_list)
df = df.drop(['father', 'mother', 'fathermon', 'fathertype', 'legtype', 'jocky',
'trainer'], axis=1)
このようにダミー変数化をした際
に特徴量の数を増やし過ぎないよ
うにグループを作って変数化する。
29