Я использую dplyr на R и пытаюсь отфильтровать таблицу, содержащую данные транзакций.
Интересующие меня столбцы: «Страна» и «Продажи».
У меня естьмного стран, и для целей разведки я хочу проанализировать только ТОП-5 стран с наибольшим объемом продаж.
Проблема здесь в том, что если я сделаю какую-то группировку, это не сработает для меня, так как мне нужны всестроки для дальнейшего анализа (транзакционные данные).
Я пробовал что-то вроде:
trans_merch_df %>% group_by(COUNTRY) %>% top_n(n = 5, wt = NET_SLS_AMT)
Но он полностью выключен.
Допустим, у меня есть это:
trans_merch_df <- tibble::tribble(~COUNTRY, ~SALE,
'POR', 14,
'POR', 1,
'DEU', 4,
'DEU', 6,
'POL', 8,
'ITA', 1,
'ITA', 1,
'ITA', 1,
'SPA', 1,
'NOR', 50,
'NOR', 10,
'SWE', 42,
'SWE', 1)
Ожидаемый результат:
COUNTRY SALE
POR 14
POR 1
DEU 4
DEU 6
POL 8
NOR 50
NOR 10
SWE 42
SWE 1
Поскольку ITA и SPA не входят в ТОП-5 продаж.
Заранее большое спасибо.
Ура!