Ошибка в 1: нижний индекс за пределами границ при веб-копировании - PullRequest
0 голосов
/ 02 июля 2019

Я перебираю данные из 'https://www.gov.mb.ca/sd/fire/Fire-Situation/daily-firesituation.html'

library('rvest')
url_Manitoba <- 'https://www.gov.mb.ca/sd/fire/Fire-Situation/daily-firesituation.html'
webpage_Manitoba <- read_html(url_Manitoba)

population <- url %>%
xml2::read_html() %>%
html_nodes(xpath='//*        
[@id="Fire_Program_Template_Stuff"]/div/table/tbody/tr[7]/td') %>%
html_table()
population <- population[[1]]

Ошибка в населении [[1]]: нижний индекс вне границ

1 Ответ

0 голосов
/ 03 июля 2019

Я не уверен, что ваше утверждение xpath верно.Мне проще использовать CSS-теги для извлечения запрошенной информации.

В случае, если я вытягиваю все узлы таблицы, думаю, вас заинтересовала вторая таблица.

library('rvest')
url_Manitoba <- 'https://www.gov.mb.ca/sd/fire/Fire-Situation/daily-firesituation.html'
webpage_Manitoba <- read_html(url_Manitoba)

population <- webpage_Manitoba %>%
  html_nodes("table") %>%
  html_table(fill=TRUE)
population[[2]]

Отсюда население [[2]] - это фрейм данных с содержимым основной таблицы.Это просто вопрос запроса правильной строки и / или столбца для конкретной информации.

...