sklearn中OneHotEncoder
2017-07-13 本文已影响89人
阳光夜风
OneHotEncoder输入必须是int数组,所以直接传入字符串特征值是不行的,需要先通过LabelEncoder转化成整型特征,再传入OneHotEncoder。
le = LabelEncoder()
df.feature = le.fit_transform(df.feature)
ohe = OneHotEncoder()
trans_feature = ohe.fit_transform(df)
image.png