Получите все недели периода с R - PullRequest
0 голосов
/ 13 июля 2020

Я напишу код, потому что это сложно объяснить. Я хочу сделать следующее.

x <- as.Date("2020-01-01")
y <- as.Date("2020-03-31") 

library(lubridate)

date <- seq(x, y, by = "day")

start <- floor_date(date, 'weeks')
end <- ceiling_date(date, 'weeks') - 1

df <- data.frame(
  start_date = start,
  end_date = end
)

df <- unique(df)

df
   start_date   end_date
1  2019-12-29 2020-01-04
5  2020-01-05 2020-01-11
12 2020-01-12 2020-01-18
19 2020-01-19 2020-01-25
26 2020-01-26 2020-02-01
33 2020-02-02 2020-02-08
40 2020-02-09 2020-02-15
47 2020-02-16 2020-02-22
54 2020-02-23 2020-02-29
61 2020-03-01 2020-03-07
68 2020-03-08 2020-03-14
75 2020-03-15 2020-03-21
82 2020-03-22 2020-03-28
89 2020-03-29 2020-04-04

Я хочу вывести все соответствующие недели, введя период. Можете ли вы сделать приведенный выше код умнее?

Ответы [ 2 ]

1 голос
/ 13 июля 2020

Вы можете создать последовательность еженедельных дат, вычесть текущий день недели из каждого дня, чтобы получить start_date, и добавить 6 дней к start_date, чтобы получить end_date.

create_weekly_dataframe <- function(x, y) {
   seq_dates <- seq(x, y + 7, by = "week")
   start_date <- seq_dates - as.integer(format(x, '%u'))
   subset(data.frame(start_date = start_date, end_date = start_date + 6), 
          start_date <= y)
}

create_weekly_dataframe(x, y)


#   start_date   end_date
#1  2019-12-29 2020-01-04
#2  2020-01-05 2020-01-11
#3  2020-01-12 2020-01-18
#4  2020-01-19 2020-01-25
#5  2020-01-26 2020-02-01
#6  2020-02-02 2020-02-08
#7  2020-02-09 2020-02-15
#8  2020-02-16 2020-02-22
#9  2020-02-23 2020-02-29
#10 2020-03-01 2020-03-07
#11 2020-03-08 2020-03-14
#12 2020-03-15 2020-03-21
#13 2020-03-22 2020-03-28
#14 2020-03-29 2020-04-04
1 голос
/ 13 июля 2020

вы могли бы использовать такой подход ... он группируется по номерам недель ISO и дает минимальную / максимальную дату из выборочных данных для каждой группы. Вы можете изменить аргумент by, чтобы получить нужные вам группы. например lubridate::epiweek(), если вам нужны недели для начала в воскресенье, см. нижнюю часть.

  1. Сначала вам нужно вычислить дату начала первой недели и дату окончания на прошлой неделе (я предполагаю, что недели начинаются в понедельник, а для воскресенья см. нижнюю часть ответа).
  2. Создайте последовательность дней от начальной до конечной
  3. сгруппируйте по номеру недели, выберите минимальную и максимальную дату для каждая группа

начало недели в понедельник

library( data.table )
library( lubridate )

x <- as.Date("2020-01-01")
y <- as.Date("2020-03-31") 

#assuming weeks start on a Monday
# calculate first date of starting week
start = x - lubridate::wday( x, week_start = 1) + 1
# calculate last date of ending week
end   = y + 7 - lubridate::wday( y, week_start = 1 ) 

mydata <- data.table( 
  date = seq( start, end, by = "1 days" )
)
#group dates by ISO weeknumber, return min and max data
mydata[, 
       .( start = min(date), end = max(date) ), 
       by = .( weeknumber = lubridate::isoweek( date ) ) ]

#     weeknumber      start        end
#  1:          1 2019-12-30 2020-01-05
#  2:          2 2020-01-06 2020-01-12
#  3:          3 2020-01-13 2020-01-19
#  4:          4 2020-01-20 2020-01-26
#  5:          5 2020-01-27 2020-02-02
#  6:          6 2020-02-03 2020-02-09
#  7:          7 2020-02-10 2020-02-16
#  8:          8 2020-02-17 2020-02-23
#  9:          9 2020-02-24 2020-03-01
# 10:         10 2020-03-02 2020-03-08
# 11:         11 2020-03-09 2020-03-15
# 12:         12 2020-03-16 2020-03-22
# 13:         13 2020-03-23 2020-03-29
# 14:         14 2020-03-30 2020-04-05

начало недели в воскресенье

start = x - lubridate::wday( x, week_start = 7) + 1  #!! <-- week_start = 7
# calculate last date of ending week
end   = y + 7 - lubridate::wday( y, week_start = 7 ) #!! <-- week_start = 7

mydata <- data.table( 
  date = seq( start, end, by = "1 days" )
)
#group dates by ISO weeknumber, return min and max data
mydata[, 
       .( start = min(date), end = max(date) ), 
       by = .( weeknumber = lubridate::epiweek( date ) ) ] #!! <-- epiweek

#     weeknumber      start        end
#  1:          1 2019-12-29 2020-01-04
#  2:          2 2020-01-05 2020-01-11
#  3:          3 2020-01-12 2020-01-18
#  4:          4 2020-01-19 2020-01-25
#  5:          5 2020-01-26 2020-02-01
#  6:          6 2020-02-02 2020-02-08
#  7:          7 2020-02-09 2020-02-15
#  8:          8 2020-02-16 2020-02-22
#  9:          9 2020-02-23 2020-02-29
# 10:         10 2020-03-01 2020-03-07
# 11:         11 2020-03-08 2020-03-14
# 12:         12 2020-03-15 2020-03-21
# 13:         13 2020-03-22 2020-03-28
# 14:         14 2020-03-29 2020-04-04
...