Question

Я написал программу, которая работает с проблемой 3n + 1 («удивительные числа» и другие). Но у него есть двойная петля. Как я мог это векторизовать?

код

count <- vector("numeric", 100000)
L <- length(count)

for (i in 1:L)
{
x <- i
   while (x > 1)
   {
   if (round(x/2) == x/2) 
     {
     x <- x/2
     count[i] <- count[i] + 1 
     } else
     {
     x <- 3*x + 1
     count[i] <- count[i] + 1
     }
   }
}

Спасибо!

Martin Morgan · Answer 1 · 19 декабря 2010

Я превратил это «наизнанку», создав вектор x, где i-й элемент - это значение после каждой итерации алгоритма.Результат относительно понятен как

f1 <- function(L) {
    x <- seq_len(L)
    count <- integer(L)
    while (any(i <- x > 1)) {
        count[i] <- count[i] + 1L
        x <- ifelse(round(x/2) == x/2, x / 2, 3 * x + 1) * i
    }
    count
}

. Это можно оптимизировать, чтобы (а) отслеживать только те значения, которые все еще находятся в игре (через idx), и (б) избегать ненужных операций, например, ifelse оценивает оба аргумента для всехзначения x, x / 2 оцениваются дважды.

f2 <- function(L) {
    idx <- x <- seq_len(L)
    count <- integer(L)
    while (length(x)) {
        ix <- x > 1
        x <- x[ix]
        idx <- idx[ix]
        count[idx] <- count[idx] + 1L
        i <- as.logical(x %% 2)
        x[i] <- 3 * x[i] + 1
        i <- !i
        x[i] <- x[i] / 2
    }
    count
}

с f0 исходной функцией, у меня есть

> L <- 10000
> system.time(ans0 <- f0(L))
   user  system elapsed 
  7.785   0.000   7.812 
> system.time(ans1 <- f1(L))
   user  system elapsed 
  1.738   0.000   1.741 
> identical(ans0, ans1)
[1] TRUE
> system.time(ans2 <- f2(L))
   user  system elapsed 
  0.301   0.000   0.301 
> identical(ans1, ans2)
[1] TRUE

Подстройка заключается в обновлении нечетных значений до 3 * x [i]+ 1 и затем делим на два безоговорочно

x[i] <- 3 * x[i] + 1
count[idx[i]] <- count[idx[i]] + 1L
x <- x / 2
count[idx] <- count[idx] + 1

С этим как f3 (не уверен, почему f2 медленнее этим утром!) Я получаю

> system.time(ans2 <- f2(L))
   user  system elapsed 
   0.36    0.00    0.36 
> system.time(ans3 <- f3(L))
   user  system elapsed 
  0.201   0.003   0.206 
> identical(ans2, ans3)
[1] TRUE

Кажется, что большие шагиможет быть взято на этапе деления на два, например, 8 - это 2 ^ 3, поэтому мы могли бы сделать 3 шага (добавить 3 к счету) и закончить, 20 - это 2 ^ 2 * 5, чтобы мы могли сделать два шага и ввестиследующая итерация в 5. Реализации?

Gavin Simpson · Answer 2 · 19 декабря 2010

Поскольку вам нужно перебирать значения x, вы не можете векторизовать это. В какой-то момент R должен работать с каждым значением x отдельно и по очереди. Возможно, вы сможете запустить вычисления на отдельных ядрах процессора, чтобы ускорить процесс, возможно, используя foreach в пакете с тем же именем.

В противном случае (а это просто скрывает цикл от вас), оберните основной цикл вашего цикла как функцию, например ::

wonderous <- function(n) {
    count <- 0
    while(n > 1) {
        if(isTRUE(all.equal(n %% 2, 0))) {
            n <- n / 2
        } else {
            n <- (3*n) + 1
        }
        count <- count + 1
    }
    return(count)
}

и затем вы можете использовать sapply() для запуска функции на наборе чисел:

> sapply(1:50, wonderous)
 [1]   0   1   7   2   5   8  16   3  19   6  14   9   9  17  17
[16]   4  12  20  20   7   7  15  15  10  23  10 111  18  18  18
[31] 106   5  26  13  13  21  21  21  34   8 109   8  29  16  16
[46]  16 104  11  24  24

Или вы можете использовать Vectorize для возврата векторизованной версии wonderous, которая сама является функцией, которая скрывает от вас даже больше:

> wonderousV <- Vectorize(wonderous)
> wonderousV(1:50)
 [1]   0   1   7   2   5   8  16   3  19   6  14   9   9  17  17
[16]   4  12  20  20   7   7  15  15  10  23  10 111  18  18  18
[31] 106   5  26  13  13  21  21  21  34   8 109   8  29  16  16
[46]  16 104  11  24  24

Я думаю, что на данный момент это почти то, что вы можете получить с помощью стандартных инструментов R.@Martin Morgan показывает, что вы можете сделать намного лучше, чем это, с помощью оригинального подхода к решению проблемы, которая использует использованных векторизованных способностей Р.

Martin Morgan · Answer 3 · 20 декабря 2010

Другой подход признает, что часто пересматривают низкие числа, так почему бы не запомнить их и сохранить стоимость перерасчета?

memo_f <- function() {
    e <- new.env(parent=emptyenv())
    e[["1"]] <- 0L
    f <- function(x) {
        k <- as.character(x)
        if (!exists(k, envir=e))
            e[[k]] <- 1L + if (x %% 2) f(3L * x + 1L) else f(x / 2L)
        e[[k]]
    }
    f
}

, что дает

> L <- 100
> vals <- seq_len(L)
> system.time({ f <- memo_f(); memo1 <- sapply(vals, f) })
   user  system elapsed 
  0.018   0.000   0.019 
> system.time(won <- sapply(vals, wonderous))
   user  system elapsed 
  0.921   0.005   0.930 
> all.equal(memo1, won) ## integer vs. numeric
[1] TRUE

Это может не очень хорошо распараллелить, но тогда, может быть, это не нужно при 50-кратном ускорении? Также рекурсия может быть слишком глубокой, но рекурсия может быть записана в виде цикла (который, возможно, быстрее, в любом случае).

Нужны советы по избавлению от петель

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нужны советы по избавлению от петель

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы