Используя пакет dplyr, все, что вам нужно сделать, это соединиться общей переменной, в данном случае названием страны. Поскольку в одном фрейме данных имя называется countryName
, а в другом country_name
, нам просто нужно указать, что они на самом деле принадлежат одной и той же переменной.
library(dplyr)
library(stringr)
df %>%
left_join(df8, by = c("countryName" = "country_name")) %>%
mutate(population = as.numeric(str_remove_all(population, ","))) %>%
group_by(countryName) %>%
slice_tail(1) %>%
group_by(region) %>%
summarize(population = sum(population, na.rm = TRUE))
# A tibble: 5 x 2
region population
* <chr> <dbl>
1 Africa 1304908713
2 Americas 1019607512
3 Asia 4592311527
4 Europe 738083720
5 Oceania 40731992