У меня есть следующие данные:
> head(inc2)
OBJECTID District MZ_ID FROM_DATE FREQUENCY SUM_violen SUM_nonvio SUM_all_pt RealDate
1 1 Eastern Outside MZ 4/6/2019 0:00 12 8 10 12 2019-04-06
2 2 Eastern Outside MZ 4/7/2019 0:00 7 2 5 7 2019-04-07
3 3 Eastern Outside MZ 4/8/2019 0:00 9 4 7 9 2019-04-08
4 4 Eastern Outside MZ 4/9/2019 0:00 4 2 2 4 2019-04-09
5 5 Eastern Outside MZ 4/10/2019 0:00 8 7 5 8 2019-04-10
6 6 Eastern Outside MZ 4/11/2019 0:00 9 3 8 9 2019-04-11
Period Period2 pnum
1 <NA> 1 NA
2 2019-04-06 - 2019-04-20 1 1
3 2019-04-06 - 2019-04-20 1 1
4 2019-04-06 - 2019-04-20 1 1
5 2019-04-06 - 2019-04-20 1 1
6 2019-04-06 - 2019-04-20 1 1
>
Я использовал приведенный ниже код для построения переменных Period, RealDate и Period2. (pnum - это просто номер недели)
inc2$RealDate <- as.Date(inc2$FROM_DATE, format = "%m/%d/%Y")
inc2$RealDate <- as.Date(inc2$FROM_DATE, format = "%m/%d/%Y")
dategp <- seq(min(inc2$RealDate), max(inc2$RealDate), by = 14)
inc2$Period <- cut.Date(inc2$RealDate, dategp,
labels = paste(dategp[-length(dategp)], dategp[-1], sep = " - "), right = TRUE)
#Find interval
inc2$Period2 <- findInterval(inc2$RealDate, dategp)
Мой вопрос: как мне создать новую переменную (строка, в которую я верю), которая принимает (для КАЖДОГО ID периода2) самое раннее значение RealDate - последнее значение RealDate Выходные данные будут иметь вид: min(RealDate) to max(RealDate)
для данного идентификатора (переменная Period2).
Спасибо.