У меня есть .xdf файл «Поезд» и «Тест».Я пытаюсь смоделировать деревья регрессии с помощью функции rxDForest, однако, когда я включаю категориальную переменную country_id
, которая имеет 49 уровней, в качестве предиктора, функция просто не завершается, и мне нужно завершить сеанс.То же самое хорошо работает с категориальной переменной.
Ниже приводится команда:
# load necessary package ---
library(RevoScaleR)
water.Dforest_2014 <- rxDForest(status.f ~ Report.Month + fecal_coliform_value + Yrs_Exist + country_id.f
, data = 'water_point.splitVar.Train.xdf'
, maxUnorderedLevels = 50
, maxDepth = 10, mTry = 2 , nTree = 2)
Чтение строк: 107443, Всего обработанных строк: 107443, Общее время порции: 0,043 секунды
Считанные строки: 107443, Всего обработанных строк: 107443, Общее время порции: 0,049 секунд
Функция не завершает выполнение после двух вышеуказанных сообщений.Здесь:
status.f
- факторная переменная со значениями «Да» или «Нет» country_id.f
- факторная переменная с 49 уровнями;и - остальные переменные являются числовыми.
У меня возникла эта проблема с файлом .xdf.Та же команда на dataframe
работает хорошо.
Могут ли предложения, пожалуйста?Thx