Question

У меня очень несбалансированный набор данных для классификации нескольких классов , и я использую XGBoost Classifier от sklearn . После разделение поезда / теста в тестовых данных есть некоторые метки, которых нет в обучающих данных. Таким образом, error возникает, когда я звонил XGBoostClassifier.fit(), так как он сначала помещает LabelEncoder в целевую переменную в обучающих данных, а затем преобразует тестовые данные. Я хочу знать, есть ли способ избежать подгонки функции LabelEncoder в XGBClassifer.fit() ( Я хочу передать в нее данные с предварительно помеченной целевой переменной).

Я обнаружил, что XGBClassifier всегда подходит для LabelEncoder (после проверки его исходного кода). Я не хочу балансировать классы в разделении данных поезда / теста. Итак, кто-нибудь может предложить альтернативный способ для этого? Заранее спасибо.

Есть ли способ передать набор данных, содержащий предварительно помеченную целевую переменную, в XGBClassifier.fit ()?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Есть ли способ передать набор данных, содержащий предварительно помеченную целевую переменную, в XGBClassifier.fit ()?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы