Привет. У меня есть группа пациентов, у которых определенное заболевание (но с разными критериями) было диагностировано в разные даты, а именно:
ID1 = c(12,14,56)
Date_ID1 = c(20160209,20120101, 20170227)
Criteria_1 = c("B","C","A")
ID2 = c(NA,43,22)
Date_ID2 = c(NA,20160710,20170227)
Criteria_2 = c(NA,"B","B")
ID3 = c(96,41,123)
Date_ID3 = c(20170227,20120101,20160601)
Criteria_3 = c("A","B","A")
test = data.frame(ID1, Criteria_1,Date_ID1,ID2, Criteria_2,Date_ID2,ID3,Criteria_3,Date_ID3)
Каждая строка представляет одного и того же пациента, новый идентификатор присваивается при каждом обследовании. Мне нужно выбрать один идентификатор для каждой строки на основе иерархических критериев (A> B> C); в случае совпадения выбранный идентификатор должен соответствовать самой ранней дате этого диагноза. Ожидается, что результат будет выглядеть следующим образом:
cbind(test,data.frame(Selected_ID = c(96,41,123)) )
Любые предложения приветствуются.