Мы могли бы использовать rvest
для получения данных.
library(rvest)
url <- "https://www.worldometers.info/coronavirus/#countries"
url %>%
read_html() %>%
html_table() %>%
.[[1]] %>%
replace(., . == '', NA)
# Country,Other TotalCases NewCases TotalDeaths NewDeaths TotalRecovered ActiveCases Serious,Critical Tot Cases/1M pop
#1 China 80,894 +13 3,237 11 69,614 8,043 2,622 56
#2 Italy 31,506 <NA> 2,503 NA 2,941 26,062 2,060 521
#3 Iran 16,169 <NA> 988 NA 5,389 9,792 <NA> 193
#4 Spain 11,826 <NA> 533 NA 1,028 10,265 563 253
#5 Germany 9,414 +47 26 NA 71 9,317 2 112
#6 S. Korea 8,413 +93 84 3 1,540 6,789 59 164
#...
Вы можете заглянуть в readr::parse_number
, чтобы преобразовать столбцы, такие как TotalCases
, NewCases
, в формат нумерации c.