Slide 8
Slide 8 text
Likelihood Encoding (1)
• カテゴリ変数を各水準における目的変数の平均値で置き換える方法
• Target Encoding, Target-Based Encoding, Mean Encodingなどとも
• カテゴリ変数を並び替えることで木構造を単純化するような効果がある
ID … v22 … target
9 … AYX … 0
12 … NFD … 0
21 … AHBW … 1
22 … GKQ … 0
23 … PYF … 1
: : : : :
v22
mean of
target
0.820
AA 0.800
AAA 1.000
AAAA 1.000
AAAB 0.923
: :
ID … v22 … target
9 … 0.667 … 0
12 … 0.846 … 0
21 … 0.857 … 1
22 … 0.727 … 0
23 … 0.692 … 1
: : : : :
集計 置換