Может быть, кто-то может помочь мне в извлечении веб-данных.
Цель: извлечь из каждой страницы появившуюся таблицу.
Моя проблема: я не могу найти правильный css, который позволяет мнепоставить кнопку «Далее» изменения страницы, которая появляется на веб-сайте.На первой странице я должен извлечь таблицу, затем на следующей, изменить страницу и извлечь вторую таблицу, которая появляется, и так далее ...
Я не могу найти css или xpath, который позволяет мнеменять страницы.Я попробовал несколько CSS ниже:
“button.a-Button.a-IRR-button.a-IRR-button—pagination”
“li.a-IRR-pagination-item”
Вот краткая сводка моего кода
library(rvest)
library(xml2)
u<-"http://transparencia.pi.gov.br/apex/f?p=101:SERVIDORES::::::"
ht<-read_html(u) %>%
html_nodes("span.a-Icon.icon-right-chevron") %>%
html_nodes("table") %>%
html_table()
ht
## Или
ht<-html_session(u) %>%
follow_link("span.a-Icon.icon-right-chevron") %>%
html_nodes("table") %>%
html_table()