Я понимаю, как использовать split
, lapply
и объединить вывод списка вместе, используя базу R. Я пытаюсь понять способ purrr , чтобы сделать это.Я могу сделать это с базой R и даже с purrr *, но я предполагаю, поскольку я, кажется, дублирую переменную order
, что я делаю это неправильно.Это кажется неуклюжим, поэтому я не думаю, что понял.
Каков подход к использованию информации из подмножеств данных для создания вложенного выходного столбца?
Подход Base R для создания вложенного столбца вфрейм данных
library(tidyverse)
set.seed(10)
dat2 <- dat1 <- data_frame(
v1 = LETTERS[c(1, 1, 1, 1, 2, 2, 2, 2)],
v2 = rep(1:4, 2),
from = c(1, 3, 2, 1, 3, 5, 2, 1),
to = c(1, 3, 2, 1, 3, 5, 2, 1) + sample(1:3, 8, TRUE)
)
dat1 <- split(dat1, dat1[c('v1', 'v2')]) %>%
lapply(function(x){
x$order <- list(seq(x$from, x$to))
x
}) %>%
{do.call(rbind, .)}
dat1
unnest(dat1)
Мой подход мурлыканья (каков правильный путь?)
dat2 %>%
group_by(v1, v2) %>%
nest() %>%
mutate(order = purrr::map(data, ~ with(., seq(from, to)))) %>%
select(-data)
Желаемый вывод
v1 v2 from to order
* <chr> <int> <dbl> <dbl> <list>
1 A 1 1 3 <int [3]>
2 B 1 3 4 <int [2]>
3 A 2 3 4 <int [2]>
4 B 2 5 6 <int [2]>
5 A 3 2 4 <int [3]>
6 B 3 2 3 <int [2]>
7 A 4 1 4 <int [4]>
8 B 4 1 2 <int [2]>