Вставить последовательность дат для каждой даты в кадре данных - PullRequest
2 голосов
/ 04 октября 2019

У меня есть фрейм данных, который имеет два столбца, Ticker и Date. Для каждого наблюдения за датой я хотел бы создать последовательность дат, которая восходит на 3 дня от первоначальной даты к первоначальной дате (например, seq(OriginalDate, OriginalDate-3, by=1))

Например:

df = data.frame(Ticker = c("AAPL", "MSFT"), Date = c("2019-01-05", "2019-02-10"))

print(df)

Ticker Date
AAPL   2019-01-05
MSFT   2019-02-10

Я бы хотел, чтобы новый фрейм данных выглядел так:

print(df)

Ticker Date        Date_Sequence
AAPL   2019-01-05  2019-01-05 #original Date
AAPL   2019-01-05  2019-01-04 #original Date -1
AAPL   2019-01-05  2019-01-03 #original Date -2
MSFT   2019-02-10  2019-02-10 
MSFT   2019-02-10  2019-02-09
MSFT   2019-02-10  2019-02-08

Ответы [ 3 ]

5 голосов
/ 04 октября 2019

Использование data.table:

library(data.table)

setDT(df)[ , .(Date_Sequence = as.Date(Date) - 0:2), .(Ticker, Date)]

#    Ticker       Date Date_Sequence
# 1:   AAPL 2019-01-05    2019-01-05
# 2:   AAPL 2019-01-05    2019-01-04
# 3:   AAPL 2019-01-05    2019-01-03
# 4:   MSFT 2019-02-10    2019-02-10
# 5:   MSFT 2019-02-10    2019-02-09
# 6:   MSFT 2019-02-10    2019-02-08
4 голосов
/ 04 октября 2019

Один из вариантов - сначала преобразовать «Дата» в класс Date, uncount, чтобы увеличить «n» раз каждую строку, сгруппированную по «Тикеру», создать последовательность обратных дат из first из 'Дата '

library(dplyr)
library(tidyr)
library(purrr)
df %>% 
   mutate(Date = as.Date(Date)) %>%
   uncount(3) %>% 
   group_by(Ticker) %>% 
   mutate(Date_Sequence = seq(first(Date), length = n(), by = '-1 day'))

Или другой вариант - создать столбец list с mutate и unnest

df %>%
  mutate(Date = as.Date(Date),
         Date_Sequence = map(Date, seq, length = 3, by = '-1 day')) %>%
  unnest_legacy(Date_Sequence)
#  Ticker       Date Date_Sequence
#1   AAPL 2019-01-05    2019-01-05
#2   AAPL 2019-01-05    2019-01-04
#3   AAPL 2019-01-05    2019-01-03
#4   MSFT 2019-02-10    2019-02-10
#5   MSFT 2019-02-10    2019-02-09
#6   MSFT 2019-02-10    2019-02-08
2 голосов
/ 04 октября 2019
df$Date <- as.Date(df$Date)
df <- df[rep(seq(nrow(df)), each = 3),]
df$Date_Sequence <- df$Date - 0:2

df
#     Ticker       Date Date_Sequence
# 1     AAPL 2019-01-05    2019-01-05
# 1.1   AAPL 2019-01-05    2019-01-04
# 1.2   AAPL 2019-01-05    2019-01-03
# 2     MSFT 2019-02-10    2019-02-10
# 2.1   MSFT 2019-02-10    2019-02-09
# 2.2   MSFT 2019-02-10    2019-02-08
...