Ниже приведен набор данных с подмножеством, мне было интересно, как мне поступить с каждым набором идентификаторов и отсортировать его по самым ранним или самым поздним датам, создать новый столбец, в котором будет указана строка перед статусом «LTD»?Цель состоит в том, чтобы идентифицировать диагноз или строку перед достижением статуса «LTD» для этого уникального идентификатора.Заранее спасибо!
Набор данных:
id <- c(123,123,123,123,123,321,321)
diag <- c("injury1", "injury2" , "cancer","injury4","cancer", "injury5", "cancer")
date <- as.Date(c('2008-11-1','2009-3-25','2010-3-14',"2010-10-14","2010-11-14", '2015-3-14', '2015-4-15'))
status <- (c("STD", "STD", "LTD", "STD","LTD","STD", "LTD"))
data <- data.frame(id, diag, date, status)
Результат (N для нет, Y для да):
123 injury1 2008-11-01 STD N
123 injury2 2009-03-25 STD Y
123 cancer 2010-03-14 LTD NA
123 injury4 2010-10-14 STD Y
123 Cancer 2010-11-14 LTD NA
321 injury5 2015-03-14 STD Y
321 cancer 2015-04-15 LTD NA