Я пытаюсь воссоздать пример, приведенный в части 3 этой статьи , которая выполняет простой расчет для нескольких экземпляров, управляемых кластером. Основной расчет происходит в этом сценарии «sim.R»:
# sim.R
# If the "batch" package has not been installed, run the line below:
# install.packages("batch", repos = "http://cran.cnr.Berkeley.edu")
seed <- 1000
n <- 50
nsim <- 10000
mu <- c(0, 0.5)
sd <- c(1, 1)
pvalue <- rep(0,nsim)
for(i in 1:nsim) {
X <- rnorm(n = n, mean = mu[1], sd = sd[1])
Y <- rnorm(n = n, mean = mu[2], sd = sd[2])
pvalue[i] <- t.test(X, Y)$p.value
power <- mean(pvalue <= 0.05)
out <- data.frame(seed = seed, nsim = nsim, n = n,
mu = paste(mu, collapse = ","),
sd = paste(sd, collapse = ","), power = power)
outfilename <- paste("res", seed, ".csv", sep = "")
write.csv(out, outfilename, row.names = FALSE)
Для запуска нескольких параллельных экземпляров sim.R, существует другой сценарий «param-sim.R»
seed <- 1000
for(i in 1:10) {
seed <- rbatch("sim.R", seed = seed, n = 25, mu = c(0, i / 10))
rbatch.local.run() # My understanding from the linked paper is that this line will do nothing if the script is run on a mosix cluster and not locally.
Чтобы запустить это на кластере mosix, я использую следующую команду из терминала:
R --vanilla --args RBATCH mosix < param-sim.R
Я ожидаю, что этот вывод сгенерирует 10 файлов .csv, помеченных res1000.csv - res1009.csv , Вместо этого вот что я получаю (я запускаю эту команду в среде Ubuntu):
$ R --vanilla --args RBATCH mosix < param-sim.R
R version 3.4.4 (2018-03-15) -- "Someone to Lean On"
Platform: x86_64-pc-linux-gnu (64-bit)
> library("batch")
> seed <- 1000
> for(i in 1:10) {
+ seed <- rbatch("sim.R", seed = seed, n = 25, mu = c(0, i / 10))
+ rbatch.local.run()
+ }
nohup mosrun -e -b -q R --vanilla --args seed 1000 n 25 mu "c(0,0.1)" < sim.R > sim.Rout1000 &
rbatch.local.run: no commands have been batched.
nohup: redirecting stderr to stdout
nohup mosrun -e -b -q R --vanilla --args seed 1001 n 25 mu "c(0,0.2)" < sim.R > sim.Rout1001 &
nohup: redirecting stderr to stdout
rbatch.local.run: no commands have been batched.
nohup mosrun -e -b -q R --vanilla --args seed 1002 n 25 mu "c(0,0.3)" < sim.R > sim.Rout1002 &
rbatch.local.run: no commands have been batched.
nohup mosrun -e -b -q R --vanilla --args seed 1003 n 25 mu "c(0,0.4)" < sim.R > sim.Rout1003 & nohup:
redirecting stderr to stdout
rbatch.local.run: no commands have been batched.
nohup mosrun -e -b -q R --vanilla --args seed 1004 n 25 mu "c(0,0.5)" < sim.R > sim.Rout1004 &
nohup: redirecting stderr to stdout
rbatch.local.run: no commands have been batched.
nohup mosrun -e -b -q R --vanilla --args seed 1005 n 25 mu "c(0,0.6)" < sim.R > sim.Rout1005 &
nohup: redirecting stderr to stdout
rbatch.local.run: no commands have been batched.
nohup mosrun -e -b -q R --vanilla --args seed 1006 n 25 mu "c(0,0.7)" < sim.R > sim.Rout1006 &
nohup: redirecting stderr to stdout
rbatch.local.run: no commands have been batched.
nohup mosrun -e -b -q R --vanilla --args seed 1007 n 25 mu "c(0,0.8)" < sim.R > sim.Rout1007 &
nohup: redirecting stderr to stdout
rbatch.local.run: no commands have been batched.
nohup mosrun -e -b -q R --vanilla --args seed 1008 n 25 mu "c(0,0.9)" < sim.R > sim.Rout1008 &
nohup: redirecting stderr to stdout
rbatch.local.run: no commands have been batched.
nohup mosrun -e -b -q R --vanilla --args seed 1009 n 25 mu "c(0,1)" < sim.R > sim.Rout1009 &
nohup: redirecting stderr to stdout
rbatch.local.run: no commands have been batched.
nohup: redirecting stderr to stdout
Файлы CSV не генерируются, и каждый из выходных файлов (то есть sim.Rout1000) содержит идентичную информацию:
mosrun - MOSIX Version 4.3.4
Usage: mosrun [location-options] [program-options] {program} [args]...
mosrun -S{maxjobs} [location-options] [program-options]
mosrun -R{filename} [-O{fd=filename}][,{fd2=fn2}]... [location-options]
mosrun -I{filename}
Location options - Node specification:
-b try to start on 'best' available node
-r{hostname} start on given host
-{a.b.c.d} start on the node of given IP address
-{n} start on given logical node number
-h start on home node
Other location options:
-F do not fail if requested node is not available
-L lock, disallow automatic migration
-l unlock, allowing automatic migration
-g disallow automatic freezing
-G allow automatic freezing
-m{mb} try to run only on nodes with >= mb free memory
-A {minutes} auto checkpoint interval in minutes (0-10000000)
-N {max} max. # of checkpoints before cycle (0-10000000)
Program options:
-e unsupported system calls produce -1/errno=ENOSYS
-w as -e, but print warnings for unsupported calls
-u unsupported system calls kill mosrun (default)
-d {0-10000} specify decay rate per second in parts of 10000
-c consider program as a pure CPU job (ignore I/O)
-n reverse '-c', so to include I/O considerations
-C{filename} test given checkpoint file
-X{/directory} declare private directory
-z program arguments start at argument #0 (not #1)
Что заставляет меня думать, что программа никогда не запускалась и не входила в очередь кластера. Я также проверил системные процессы командой top и ничего не обнаружил. Кстати, мне удалось успешно запустить простые программы на C ++ в кластере mosix.
Я пропустил ключевую деталь, позволяющую этой программе работать?