rxDForest в файле xdf - PullRequest
       12

rxDForest в файле xdf

0 голосов
/ 09 октября 2018

У меня есть .xdf файл «Поезд» и «Тест».Я пытаюсь смоделировать деревья регрессии с помощью функции rxDForest, однако, когда я включаю категориальную переменную country_id, которая имеет 49 уровней, в качестве предиктора, функция просто не завершается, и мне нужно завершить сеанс.То же самое хорошо работает с категориальной переменной.

Ниже приводится команда:

# load necessary package ---
library(RevoScaleR)
water.Dforest_2014 <- rxDForest(status.f ~  Report.Month + fecal_coliform_value  +  Yrs_Exist + country_id.f
                       , data = 'water_point.splitVar.Train.xdf' 
                       , maxUnorderedLevels = 50 
                       , maxDepth = 10, mTry = 2 , nTree = 2)

Чтение строк: 107443, Всего обработанных строк: 107443, Общее время порции: 0,043 секунды

Считанные строки: 107443, Всего обработанных строк: 107443, Общее время порции: 0,049 секунд

Функция не завершает выполнение после двух вышеуказанных сообщений.Здесь:

  • status.f - факторная переменная со значениями «Да» или «Нет»
  • country_id.f - факторная переменная с 49 уровнями;и
  • остальные переменные являются числовыми.

У меня возникла эта проблема с файлом .xdf.Та же команда на dataframe работает хорошо.

Могут ли предложения, пожалуйста?Thx

...