Возврат результата из распараллеленного цикла for - PullRequest
0 голосов
/ 27 мая 2018

Я хочу смоделировать данные и одновременно выполнить анализ этих данных 10000 раз.Поэтому я использовал цикл for в R, чтобы повторить работу 10000 раз.Теперь я хочу распараллелить эту задачу.Для которого я следовал следующим кодам:

library(parallel)
library(doSNOW)
cl <- makeSOCKcluster(3)
registerDoSNOW(cl)

progress <- function(n) cat(sprintf("task %d is complete\n", n)) # to check the progress of the work

setno<- data.frame(sample_no=c(1:10000))
no_of_samples<- unique(setno$sample_no)

simulated_data_list <- vector("list",length(no_of_samples))
analysis_result <-  numeric(length(simulated_data_list ))

foreach(i=1:10000,progress)%dopar%{
 tryCatch({
 simulated_data_list[[i]]<-  rnorm(100)# suppose we are simulating data 
 analysis_result[[i]] <-  1-pnorm(simulated_data_list[[i]][1])
 },error=function(e){cat("ERROR:",conditionMessage(e),"\n")})
}

Но каждый раз, когда я делаю это, я обнаруживаю, что программа не симулирует данные (в программном коде нет проблем, поскольку он работает нормально без распараллеливания).Я не могу понять, где проблема в приведенном выше коде.Можете ли вы предложить лучший способ сделать эту работу?

1 Ответ

0 голосов
/ 27 мая 2018

Вы должны return получить результат из цикла foreach.Например:

library(parallel)
library(doSNOW)
cl <- makeSOCKcluster(3)
registerDoSNOW(cl)

result <- foreach(i = 1:5) %dopar% {
    sim <- rnorm(2)
    list(sim , 1 - pnorm(sim[1]))
}
simulated_data_list <- lapply(result, "[[", 1)
analysis_result <- lapply(result, "[[", 2)

Например, используя простой for, мы можем добавить в список, но foreach не работает так:

dummyList <- list()
dummyList2 <- list()
foreach(i = 1:5) %dopar% {
    dummyList[[i]] <- rnorm(2)
}
for(i in 1:5) {
    dummyList2[[i]] <- rnorm(2)
}
lapply(list(dummyList, dummyList2), length)

[[1]]
[1] 0
[[2]]
[1] 5
...