R как получить нет. поиск городов по количеству различных посетителей - PullRequest
0 голосов
/ 01 декабря 2019

У меня есть набор данных, который выглядит следующим образом:

fullVisitorId  VisitId visitNumber City
1010122109733  1513354 1           Bangkok
1010164109733  1513366 8           Kuala Lumpur
1010122165452  1513354 5           Tokyo
1010198798713  1517773 10          Seoul

Используя dplyr в R, как я могу получить

no. of cities searched | count of distinct visitorid
1                      | 500
2                      | 300
3                      | 10 

Я хотел бы получить нет. количество найденных городов и количество уникальных посетителей

1 Ответ

0 голосов
/ 01 декабря 2019

Один из вариантов может заключаться в группировании по 'fullVisitorId', summarise путем получения номера отдельного 'City', а также отдельного 'fullVisitorId', и применения top_n

library(dplyr)
df1 %>%
   group_by(fullVisitorId) %>% 
   summarise(ncities = n_distinct(City), 
             countdistinctvisitorid = n_distinct(fullVisitorId)) %>% 
   top_n(countdistinctvisitorid, 3)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...