У меня есть набор данных, который я бы хотел горячо кодировать, используя sklearn.preprocessing.OneHotEncoder . Моя проблема в том, что после кодирования результат содержит меньше строк, чем исходный набор данных (разница 5). Вот мой код:
one_hot_encoder = OneHotEncoder(handle_unknown='ignore', sparse=False)
X_cat = pd.DataFrame(
one_hot_encoder.fit_transform(X[categorical_vars]),
columns=one_hot_encoder.get_feature_names(categorical_vars)
)
Спасибо за любые советы заранее. :)