library(data.table)
testset <- data.table(date=as.Date(c("2013-07-02","2013-08-03","2013-09-04",
"2013-10-05","2013-11-06")),
yr = c(2013,2013,2013,2013,2013),
mo = c(07,08,09,10,11),
da = c(02,03,04,05,06),
plant = LETTERS[1:5],
product = as.factor(letters[26:22]),
rating = runif(25))
У меня есть этот набор данных, который для каждой строки я хочу создать категорию или наименование в этой строке в зависимости от столбца даты. Я хочу сравнить эту дату с датами в другом наборе данных:
library(lubridate)
splitDates <- ymd(c("2013-06-10", "2013-08-15", "2013-10-06"))
Использование splitDates Я хочу оценить, какое значение в splitDates было последним до того, как было выполнено измерение. (Если вы предполагаете, что новый эксперимент проводился с 2013-06-10 и до 2013-08-15, но я хочу решить, к какому эксперименту относится измерение).
Как я вижу, первые пять строк в этом новом столбце должны выглядеть следующим образом:
NewColumn <- c("2013-06-10", "2013-06-10", "2013-08-15", "2013-08-15", "2013-10-06")
date yr mo da plant product rating NewColumn
1: 2013-07-02 2013 7 2 A z 0.02522850 2013-06-10
2: 2013-08-03 2013 8 3 B y 0.28274066 2013-06-10
3: 2013-09-04 2013 9 4 C x 0.86314441 2013-08-15
4: 2013-10-05 2013 10 5 D w 0.01670862 2013-08-15
5: 2013-11-06 2013 11 6 E v 0.16034175 2013-10-06
...
Я не могу понять, как это сделать.