Очистка данных, хранящихся в таблице веб-сайта - PullRequest
0 голосов
/ 16 мая 2019

Я пытаюсь удалить таблицу с веб-сайта, используя пакет rvest R.

Сайт: https://www.wunderground.com/history/daily/es/san-bartolom%C3%A9/GCRR/date/2017-11-1

Я нашел селектор таблицы через Google Chrome (осмотреть)

#history-observation-table > tbody

Я использую следующий код:

url <- "https://www.wunderground.com/history/daily/es/san-bartolom%C3%A9/GCRR/date/2017-11-1"

webpage <- read_html(url)

node <- html_nodes(webpage, '#history-observation-table > tbody')

data <- html_text(node)

Я получаю 0, хотя при попытке увидеть, какой узел имеет.

Я думаю, что данные таблицы не в простом формате HTML. Javascript может быть использован? Более того, я заметил, что страница таблицы загружается через 2 или 3 секунды. Сначала появляется сообщение об отсутствии доступных данных, а через некоторое время появляется таблица.

...