Параллельные вычисления в R без дублирования кадра входных данных - PullRequest
0 голосов
/ 04 августа 2020

Я использую параллельные вычисления для метода randomForest в R. К сожалению, моим узким местом здесь является оперативная память. Кажется, что R дублирует фрейм входных данных my_data. Могу ли я остановить дублирование и сделать my_data общим объектом?

cl <- makeCluster(11)
registerDoParallel(cl)

rf_res <- foreach(ntree = rep(90, 11), .combine=randomForest::combine, .multicombine=TRUE, .packages = "randomForest") %dopar% 
    randomForest(F_BIN~., data=my_data, ntree=ntree, keep.forest=FALSE, importance=TRUE)

rf_im <- importance(rf_res)

stopCluster(cl)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...