Для данных примера:
set.seed(2222)
example_data <- data.frame(col1 = 1:15,
col2 = 16:30,
group = sample(1:3, 15, replace = TRUE))
col1 col2 group
1 1 16 2
2 2 17 1
3 3 18 3
4 4 19 2
5 5 20 3
6 6 21 1
7 7 22 3
8 8 23 1
9 9 24 3
10 10 25 1
11 11 26 2
12 12 27 2
13 13 28 2
14 14 29 3
15 15 30 3
Я хочу найти n верхних групп с наибольшим количеством записей.
Допустим, я хочу получить 2 верхние группы снаибольшее количество записей.В данных это группы 3 и 2:
example_data %>%
group_by(group) %>%
summarise(n = n())
# A tibble: 3 x 2
group n
<int> <int>
1 1 4
2 2 5
3 3 6
Ожидаемый результат:
col1 col2 group
1 1 16 2
2 3 18 3
3 4 19 2
4 5 20 3
5 7 22 3
6 9 24 3
7 11 26 2
8 12 27 2
9 13 28 2
10 14 29 3
11 15 30 3