У меня есть данные о состоянии здоровья из когортного исследования с повторными измерениями, где людей посещают несколько раз в год. В начале исследования (посещение 0) у некоторых людей уже диагностирована интересующая болезнь, а у других нет. Поскольку я смотрю на случаи инцидентов в своем анализе, мне нужно удалить из моих данных тех людей, которые были диагностированы как «больные» на 0 посещении. Как я могу сделать это в Tidyverse? Ниже приведен пример структуры данных, на которую я буду смотреть:
subject_id <- c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5)
visit <- c(0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3,0,1,2,3)
diagnosis <- c("not sick", "not sick", "not sick", "sick", "sick", "sick", "sick", "sick", "not sick", "not sick", "sick", "sick", "sick", "sick", "sick", "sick", "not sick", "not sick", "not sick", "sick")
cohort <- data.frame(subject_id, visit, diagnosis)
cohort