XGBoost мультиклассовая ошибка кодирования категориальной метки - PullRequest
0 голосов
/ 14 января 2020

Согласно документации XGBoost, категорические функции не поддерживаются. Поэтому я пытаюсь кодировать ярлыки своих категорий в горячем режиме, используя функциональность pd.get_dummies(). Однако, когда я создаю объект DMatrix ниже, я получаю сообщение об ошибке, говорящее о том, что у меня не может быть нескольких столбцов для моей метки в DMatrix

features = pd.get_dummies(df_features)
labels = pd.get_dummies(df_labels)

train_features, test_features, train_labels, test_labels = train_test_split(features, labels,
                                                                                test_size=0.25,
                                                                                random_state=42)

dtrain = xgb.DMatrix(train_features,label=train_labels)

Ошибка:

ValueError: DataFrame для метки не может быть несколько столбцов

Как решить эту проблему?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...