Создать перекрывающийся вектор даты на основе начальной даты - PullRequest
1 голос
/ 02 мая 2020

Просто смотрю, есть ли более интуитивный способ сделать это. Мне нужно создать перекрывающиеся интервалы дат от указанной c даты начала до текущей даты. Например, мой первый интервал будет (2019-01-01 - 2019-04-30), в то время как мой следующий интервал (2019-03-01 - 2019-05-31), так что будет перекрытие не менее 1 месяца.

Вот мой код:

library(dplyr)
library(lubridate)
current_date <- today()
start_date <- as.Date("2019-01-01")
i <- NULL
interval_vector <- c() # to store
for(i in 1:length(months_sequence)){
  # define end date (90 days)
  end_date <- ceiling_date(start_date + (days(90)),unit = "month") - 1
  interval_vector[[i]] <- paste0(start_date, " ", end_date)
  # define new start date
  start_date <- floor_date(end_date - days(30), unit = "month")
  # drop future dates
  interval_vector <- interval_vector[interval_vector < current_date]
  # interval_vector <- interval_vector
}
interval_vector

Вот результат:

[1] "2019-01-01 2019-04-30" "2019-03-01 2019-05-31" "2019-05-01 2019-07-31" "2019-07-01 2019-09-30" "2019-08-01 2019-10-31"
[6] "2019-10-01 2019-12-31" "2019-12-01 2020-02-29" "2020-01-01 2020-03-31" "2020-03-01 2020-05-31" NA                     
[11] NA                      NA                      NA                      NA                      NA                     
[16] NA  

Два вопроса:

  1. Есть ли лучше способ сделать это?
  2. Почему он возвращает NA и как я могу их отбросить?

Спасибо всем

1 Ответ

0 голосов
/ 02 мая 2020

lubridate имеет функцию интервала. См .: https://cran.r-project.org/web/packages/lubridate/vignettes/lubridate.html

Пример

library(lubridate)

t <- as.POSIXct("2019-01-01", tz = "UTC")
n <- 16
arrive <- seq(t, by = "month", length.out = n)
depart <- tail(seq(t, by = "month", length.out = n+2), -2)
interval(arrive, depart)

Результат

 [1] 2019-01-01 UTC--2019-03-01 UTC 2019-02-01 UTC--2019-04-01 UTC
 [3] 2019-03-01 UTC--2019-05-01 UTC 2019-04-01 UTC--2019-06-01 UTC
 [5] 2019-05-01 UTC--2019-07-01 UTC 2019-06-01 UTC--2019-08-01 UTC
 [7] 2019-07-01 UTC--2019-09-01 UTC 2019-08-01 UTC--2019-10-01 UTC
 [9] 2019-09-01 UTC--2019-11-01 UTC 2019-10-01 UTC--2019-12-01 UTC
[11] 2019-11-01 UTC--2020-01-01 UTC 2019-12-01 UTC--2020-02-01 UTC
[13] 2020-01-01 UTC--2020-03-01 UTC 2020-02-01 UTC--2020-04-01 UTC
[15] 2020-03-01 UTC--2020-05-01 UTC 2020-04-01 UTC--2020-06-01 UTC

Или, без lubridate, простая вставка создаст векторы символов в точности как вы описываете

paste(format(arrive, "%F"), format(depart, "%F"), sep = " ")

Результат

 [1] "2019-01-01 2019-03-01" "2019-02-01 2019-04-01" "2019-03-01 2019-05-01"
 [4] "2019-04-01 2019-06-01" "2019-05-01 2019-07-01" "2019-06-01 2019-08-01"
 [7] "2019-07-01 2019-09-01" "2019-08-01 2019-10-01" "2019-09-01 2019-11-01"
[10] "2019-10-01 2019-12-01" "2019-11-01 2020-01-01" "2019-12-01 2020-02-01"
[13] "2020-01-01 2020-03-01" "2020-02-01 2020-04-01" "2020-03-01 2020-05-01"
[16] "2020-04-01 2020-06-01"
...