Согласно документации XGBoost, категорические функции не поддерживаются. Поэтому я пытаюсь кодировать ярлыки своих категорий в горячем режиме, используя функциональность pd.get_dummies()
. Однако, когда я создаю объект DMatrix
ниже, я получаю сообщение об ошибке, говорящее о том, что у меня не может быть нескольких столбцов для моей метки в DMatrix
features = pd.get_dummies(df_features)
labels = pd.get_dummies(df_labels)
train_features, test_features, train_labels, test_labels = train_test_split(features, labels,
test_size=0.25,
random_state=42)
dtrain = xgb.DMatrix(train_features,label=train_labels)
Ошибка:
ValueError: DataFrame для метки не может быть несколько столбцов
Как решить эту проблему?