У меня есть большой набор данных, более 1,5 миллионов строк, из 600 000 уникальных предметов, поэтому у нескольких предметов есть несколько рядов.Я пытаюсь найти случаи, когда у одного из испытуемых неправильно введен DOB.
test <- data.frame(
ID=c(rep(1,3),rep(2,4),rep(3,2)),
DOB = c(rep("2000-03-01",3), "2000-05-06", "2002-05-06",
"2000-05-06", "2000-05-06", "2004-04-06", "2004-04-06")
)
> test
ID DOB
1 1 2000-03-01
2 1 2000-03-01
3 1 2000-03-01
4 2 2000-05-06
5 2 2002-05-06
6 2 2000-05-06
7 2 2000-05-06
8 3 2004-04-06
9 3 2004-04-06
Что мне нужно, так это какой-то код, по сути идентифицирующий, что в «2» есть ошибка.Я могу подумать о некоторых способах использования цикла for, но это было бы неэффективно в вычислительном отношении.
Спасибо