Изменение столбца, содержащего уникальные комбинации символов - PullRequest
2 голосов
/ 02 октября 2019

У меня проблема с тем, что мне нужно найти уникальные номера хвостовых рейсов в наборе данных nycflights13. Затем мне нужно найти хвост данных с наибольшим количеством уникальных направлений в любом из аэропортов в наборе данных.

Я пытался включить уникальное значение tailnum в качестве столбца или определить tailnum как отдельный, прежде чем поместить его в мою трубу, но, похоже, ни один из них не работает.

flights %>%
    count(tailnum, dest) %>%
    arrange(-n) %>%
    na.omit(tailnum_new) %>%
    print()

Этот код дает мне таблицу с номером хвоста самолета, пунктом назначения и сколько раз этот хвост выпал из этого места, но я хочу только уникальные наблюдения в моей переменной хвоста. Любая помощь приветствуется!

Ответы [ 2 ]

0 голосов
/ 02 октября 2019
flights %>%
    filter(!is.na(tailnum)) %>%
    count(tailnum, dest) %>%
    count(tailnum, sort = TRUE) %>%
    slice(1)
## A tibble: 1 x 2
#  tailnum     n
#  <chr>   <int>
#1 N11194     47
0 голосов
/ 02 октября 2019

Мы можем сделать

library(dplyr)
flights %>%
   filter(complete.cases(tailnum)) %>%
   group_by(tailnum) %>% 
   summarise(n = n_distinct(dest)) %>% 
   ungroup %>%
   slice(which.max(n))
# A tibble: 1 x 2
#  tailnum     n
#  <chr>   <int>
#1 N11194     47
...