Сортируйте самые высокие значения, комбинируя наборы данных - PullRequest
0 голосов
/ 07 мая 2020
df <- read.csv ('https://raw.githubusercontent.com/ulklc/covid19- 
timeseries/master/countryReport/raw/rawReport.csv',
            stringsAsFactors = FALSE)
 df8 <- read.csv ('https://raw.githubusercontent.com/hirenvadher954/Worldometers- 
 Scraping/master/countries.csv',
             stringsAsFactors = FALSE)

library(tidyverse)

    df %>% 
   left_join(df8, by = c("countryName" = "country_name")) %>% 
   mutate(population = as.numeric(str_remove_all(population, ","))) %>% 
    group_by(countryName) %>% 
     group_by(countryName) %>% 
  unique() %>% 
  summarize(population = sum(population, na.rm = TRUE),
        confirmed = sum(confirmed, na.rm = TRUE),
        recovered = sum(recovered, na.rm = TRUE),
        death = sum(death, na.rm = TRUE),
        death_prop = paste0(as.character(death), "/", as.character(population)),
        confirmed_prop = paste0(as.character(confirmed), "/", as.character(population)),
        recovered_prop = paste0(as.character(recovered), "/", as.character(population)),
        )

соотношение населения / смертности рассчитывается в этом коде.

я хочу найти 10 стран с самым высоким соотношением населения / смертности.

в качестве результата;

counrtyName death population rate

İtaly 19000 50000000000 19/50000000

spain 17000 60000000000 17/60000000

....

.....

....

....

.... Приведенные мной примеры не являются реальными данными.

примеры не отражают реальность.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...