Ошибка XGBoost в R Studio («данные» имеют класс «символ» и длину ... ») - PullRequest
0 голосов
/ 13 сентября 2018

У меня возникли трудности при адаптации моих данных к модели классификатора xgboost.Когда я запускаю это:

classifier = xgboost(data = as.matrix(training_set[c(4:15, 17:18,20:28)]), 
  label = training_set$posted_ind, nrounds = 10)

R Studio сообщает мне:

Error in xgb.DMatrix(data, label = label, missing = missing) : 
'data' has class 'character' and length 1472000.
'data' accepts either a numeric matrix or a single filename. 

Данные обучающего набора содержат как непрерывные, так и категориальные данные, но все категориальные данные были закодированы как таковые (иодни и те же данные соответствуют моделям случайных лесов и наивных байесов)Есть ли какой-то дополнительный шаг, который мне нужно выполнить, чтобы я мог использовать эти данные в модели xgboost?

1 Ответ

0 голосов
/ 02 мая 2019

Убедитесь, что в вашем "training_set" нет столбцов, которые являются факторами. Если вы закодировали свои категориальные переменные как числовые, но преобразовали их как факторы, вы получите эту ошибку.

...