Как повернуть таблицу, используя последовательность четвертей между двумя датами - PullRequest
0 голосов
/ 02 октября 2018

У меня есть фрейм данных с двумя столбцами даты (от и до).Я хотел бы создать последовательность года и квартала между двумя датами, а затем изменить форму, чтобы преобразовать их в длинный фрейм данных.

df <- structure(list(id = 1:4, from = structure(c(1L, 1L, 2L, 2L), .Label = c("2018-01-01", "2018-04-01"), class = "factor"), to = structure(c(2L, 1L, 4L, 3L), .Label = c("2018-02-01", "2018-04-01", "2018-07-01", "2018-10-01"), class = "factor")), class = "data.frame", row.names = c(NA, -4L))

> df
id      from        to
1       2018-01-01  2018-04-01
2       2018-01-01  2018-02-01
3       2018-04-01  2018-10-01
4       2018-04-01  2018-07-01

В приведенном выше примере идентификатор 1 находится в Q1 и Q2, тогда как идентификатор 2 -только в Q1.

Желаемый вывод:

#id Quarter
#1  Q1 2018
#1  Q2 2018
#2  Q1 2018
#3  Q2 2018
#3  Q3 2018
#3  Q4 2018
#4  Q2 2018
#4  Q3 2018

Я могу получить четверть последовательности, используя функцию seq:

dsq <- seq(ymd('2018-01-01'),ymd('2018-04-01'), by = 'quarters')
paste0("Q", lapply(dsq, quarter), " ", lapply(dsq, year))

, но я ищуспособ изменить мою таблицу, используя полученную последовательность.

Любая помощь приветствуется.

Ответы [ 2 ]

0 голосов
/ 02 октября 2018

Вы можете сделать это, добавив немного кода:

f <- function(x,y) {
  dsq <- seq(ymd(x),ymd(y), by = 'quarters')
  paste0("Q", lapply(dsq, quarter), " ", lapply(dsq, year))
}

df %>% rowwise %>% mutate(quarter=list(f(from,to))) %>% unnest
## A tibble: 8 x 4
#     id from       to         quarter      
#  <int> <fct>      <fct>      <chr>  
#1     1 2018-01-01 2018-04-01 Q1 2018
#2     1 2018-01-01 2018-04-01 Q2 2018
#3     2 2018-01-01 2018-02-01 Q1 2018
#4     3 2018-04-01 2018-10-01 Q2 2018
#5     3 2018-04-01 2018-10-01 Q3 2018
#6     3 2018-04-01 2018-10-01 Q4 2018
#7     4 2018-04-01 2018-07-01 Q2 2018
#8     4 2018-04-01 2018-07-01 Q3 2018
0 голосов
/ 02 октября 2018

Мы можем сделать

library(zoo)
library(tidyverse)
df %>% 
  mutate_at(2:3, zoo::as.yearqtr, format = "%Y-%m-%d") %>% 
  gather(key, Quarter, -id) %>% 
  select(-key) %>% 
  arrange(id)
#  id Quarter
#1  1 2018 Q1
#2  1 2018 Q2
#3  2 2018 Q1
#4  2 2018 Q1
#5  3 2018 Q2
#6  3 2018 Q4
#7  4 2018 Q2
#8  4 2018 Q3

Или попробовать с data.table

library(data.table)
setDT(df)[, `:=`(from = as.Date(from),
                 to = as.Date(to))
          ][, .(Quarter = as.yearqtr(seq(from, to, "quarter"))), by = id]

Если from и to уже имеют класс date, тоэто упрощается до

setDT(df)[, .(Quarter = as.yearqtr(seq(from, to, "quarter"))), by = id]
...