В Sklearn, как я могу сделать OneHotEncoding после LabelEncoding в Sklearn.
То, что я сделал до сих пор, - это то, что я сопоставил все строковые особенности моего набора данных, вот так.
# Categorical boolean mask
categorical_feature_mask = X.dtypes==object
# filter categorical columns using mask and turn it into a list
categorical_cols = X.columns[categorical_feature_mask].tolist()
После этого я применил это к столбцам набора данных с индексацией, подобной такой:
X[categorical_cols] = X[categorical_cols].apply(lambda col: le.fit_transform(col))
Мои результаты были не очень хорошими, так что я хочу сделать, чтобы я хочу использовать ÒneHotEncoding
, чтобы увидеть, улучшается ли производительность.
Это мой код:
ohe = OneHotEncoder(categorical_features = categorical_cols)
X[categorical_cols] = ohe.fit_transform(df).toarray()
Я пробовал разные подходы, но вот что я пытаюсь выполнить sh здесь используя технику OneHotEncoding для перезаписи функций.