Вы хотите inner_join, а затем либо посчитать отдельные рейсы, либо просто перечислите аэропорты, используя distinct
. Здесь я их считаю.
library(dplyr)
inner_join(airports, flights, by=c("faa"="dest")) %>%
count(faa, name) %>% # number of flights
arrange(-n)
# A tibble: 101 x 3
faa name n
<chr> <chr> <int>
1 ORD Chicago Ohare Intl 17283
2 ATL Hartsfield Jackson Atlanta Intl 17215
3 LAX Los Angeles Intl 16174
4 BOS General Edward Lawrence Logan Intl 15508
5 MCO Orlando Intl 14082
6 CLT Charlotte Douglas Intl 14064
7 SFO San Francisco Intl 13331
8 FLL Fort Lauderdale Hollywood Intl 12055
9 MIA Miami Intl 11728
10 DCA Ronald Reagan Washington Natl 9705
# ... with 91 more rows
Таким образом, 101 из 1458 аэропортов в этом наборе данных имеют по крайней мере 1 запись в наборе данных о полетах, с Chica go 'O'Hare Intl аэропорт, выполняющий наибольшее количество рейсов из Нью-Йорка.
И просто для удовольствия, в следующем списке перечислены аэропорты, которые не имеют рейсов из Нью-Йорка:
anti_join(airports, flights, by=c("faa"="dest"))