Есть ли вспомогательная функция, чтобы сделать этот код чище на Tibble? - PullRequest
0 голосов
/ 09 января 2019

Мне нужно суммировать последовательности, сгенерированные одним из столбцов. Я сделал это так:

test <- tibble::tibble(
  x = c(1,2,3)
)
test %>% dplyr::mutate(., s = plyr::aaply(x, .margins = 1, .fun = function(x_i){sum(seq(x_i))}))

Есть ли более чистый способ сделать это? Есть ли какие-то вспомогательные функции, конструкция которых позволяет мне уменьшить это:

plyr::aaply(x, .margins = 1, .fun = function(x_i){sum(seq(x_i))})

Я ищу общее решение, здесь sum и seq - только пример. Может быть, настоящая проблема в том, что я хочу выполнить функцию на элементе, а не на всем векторе.

Это мой реальный случай:

test <- tibble::tibble(
  x = c(1,2,3),
  y = c(0.5,1,1.5)
)
d <- c(1.23, 0.99, 2.18)

test %>% mutate(., s = (function(x, y) {
  dn <- dnorm(x = d, mean = x, sd = y)
  s <- sum(dn)
  s
})(x,y))

test %>% plyr::ddply(., c("x","y"), .fun = function(row) {
  dn <- dnorm(x = d, mean = row$x, sd = row$y)
  s <- sum(dn)
  s
})

Я бы хотел сделать это с помощью функции преобразования в ряд, а не векторизованным способом.

1 Ответ

0 голосов
/ 09 января 2019

Для конкретного примера это прямое применение cumsum

test %>% 
   mutate(s = cumsum(x))

Для общих случаев, чтобы перебрать последовательность строк, мы можем использовать map

test %>% 
     mutate(s = map_dbl(row_number(), ~ sum(seq(.x))))
# A tibble: 3 x 2
#      x     s
#  <dbl> <dbl>
#1     1     1
#2     2     3
#3     3     6

Обновление

Для обновленного набора данных используйте map2, поскольку мы используем соответствующие аргументы в dnorm из столбцов 'x' и 'y' набора данных

test %>%     
    mutate(V1 = map2_dbl(x, y, ~ dnorm(d, mean = .x, sd = .y) %>% 
                     sum))
# A tibble: 3 x 3
#     x     y    V1
#  <dbl> <dbl> <dbl>
#1     1   0.5 1.56 
#2     2   1   0.929
#3     3   1.5 0.470
...