xpath с rvest завершается ошибкой, возвращая пустой список - PullRequest
0 голосов
/ 24 апреля 2020

Я застрял при использовании «rvest» для извлечения данных COVID со страницы: https://www.cdc.gov/coronavirus-interactive/index.html

Спасибо за ваше время!

Вот мой код :

library("rvest")

url = "https://www.cdc.gov/coronavirus-interactive/index.html"

tbl <- url %>%
  read_html() %>%
  html_nodes(xpath = '//*[@id="viz030_widget5_table"]') %>%
  html_table(fill=TRUE)
tbl

1 Ответ

0 голосов
/ 26 апреля 2020

Динамически восстанавливается. Вы можете получить необходимые данные в формате json из

https://www.cdc.gov/covid-data-tracker/Content/CoronaViewJson_01/US_MAP_DATA.json

Вы можете найти их на вкладке сети при обновлении исходной страницы.

library(jsonlite)

data <- jsonlite::read_json('https://www.cdc.gov/covid-data-tracker/Content/CoronaViewJson_01/US_MAP_DATA.json') %>% 
        .$US_MAP_DATA
...