Question

У меня возникли трудности при адаптации моих данных к модели классификатора xgboost.Когда я запускаю это:

classifier = xgboost(data = as.matrix(training_set[c(4:15, 17:18,20:28)]), 
  label = training_set$posted_ind, nrounds = 10)

R Studio сообщает мне:

Error in xgb.DMatrix(data, label = label, missing = missing) : 
'data' has class 'character' and length 1472000.
'data' accepts either a numeric matrix or a single filename.

Данные обучающего набора содержат как непрерывные, так и категориальные данные, но все категориальные данные были закодированы как таковые (иодни и те же данные соответствуют моделям случайных лесов и наивных байесов)Есть ли какой-то дополнительный шаг, который мне нужно выполнить, чтобы я мог использовать эти данные в модели xgboost?

user11442360 · Answer 1 · 02 мая 2019

Убедитесь, что в вашем "training_set" нет столбцов, которые являются факторами. Если вы закодировали свои категориальные переменные как числовые, но преобразовали их как факторы, вы получите эту ошибку.

Ошибка XGBoost в R Studio («данные» имеют класс «символ» и длину ... »)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Ошибка XGBoost в R Studio («данные» имеют класс «символ» и длину ... »)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы