В моих данных есть несколько строк, которые имеют одинаковые id
, но разные id2
и дату. Я хотел бы использовать строки, которые являются самыми новыми и имеют наибольшее значение id2
.
Например, в приведенном ниже наборе данных строки с 13 по 15 являются самыми новыми и имеют наибольшее значение id2
среди тех, которые имеют ту же дату.
Может быть несколько человек, которые могут выполнить это условие, поэтому я хотел бы использовать строки с 13 по 15, а не один из них.
id <- c("id7590", "id7590", "id7590", "id7590", "id7590", "id7590", "id7590", "id7590", "id7590", "id7590",
"id7590", "id7590", "id7590", "id7590", "id7590", "id7590", "id7590", "id7590", "id7590", "id7590",
"id7590")
id2 <- c("n0960999", "n0960999", "n0960999", "n0961001", "n0961001", "n0961001", "n0961002", "n0961002",
"n0961002", "n0961003", "n0961003", "n0961003", "n0961004", "n0961004", "n0961004", "n0961183",
"n0961183", "n0961183", "n0961184", "n0961184", "n0961184")
date <- c("1980-06-24", "1980-06-24", "1980-06-24", "1980-06-25", "1980-06-25", "1980-06-25", "1980-06-25",
"1980-06-25", "1980-06-25", "1980-06-25", "1980-06-25", "1980-06-25", "1980-06-25", "1980-06-25",
"1980-06-25", "1980-09-24", "1980-09-24", "1980-09-24", "1980-09-24", "1980-09-24", "1980-09-24")
people <- c("14029", "3078", "7333", "14029", "7333", "3078", "7333", "14029", "3078", "7333", "14029", "3078",
"3078", "14029", "7333", "7333", "14029", "3078", "14029", "3078", "7333")
tibble(id=id, id2=id2, people=people, date=date)
id id2 people date
1 id7590 n0960999 14029 1980-06-24
2 id7590 n0960999 3078 1980-06-24
3 id7590 n0960999 7333 1980-06-24
4 id7590 n0961001 14029 1980-06-25
5 id7590 n0961001 7333 1980-06-25
6 id7590 n0961001 3078 1980-06-25
7 id7590 n0961002 7333 1980-06-25
8 id7590 n0961002 14029 1980-06-25
9 id7590 n0961002 3078 1980-06-25
10 id7590 n0961003 7333 1980-06-25
11 id7590 n0961003 14029 1980-06-25
12 id7590 n0961003 3078 1980-06-25
13 id7590 n0961004 3078 1980-06-25
14 id7590 n0961004 14029 1980-06-25
15 id7590 n0961004 7333 1980-06-25
16 id7590 n0961183 7333 1980-09-24
17 id7590 n0961183 14029 1980-09-24
18 id7590 n0961183 3078 1980-09-24
19 id7590 n0961184 14029 1980-09-24
20 id7590 n0961184 3078 1980-09-24
21 id7590 n0961184 7333 1980-09-24
Я нашел аналогичный вопрос для SQL, но я хотел бы знать, как поступить с dplyr
.