Извлечение HTML-данных - PullRequest
       4

Извлечение HTML-данных

0 голосов
/ 12 февраля 2019

Может быть, кто-то может помочь мне в извлечении веб-данных.

Цель: извлечь из каждой страницы появившуюся таблицу.

Моя проблема: я не могу найти правильный css, который позволяет мнепоставить кнопку «Далее» изменения страницы, которая появляется на веб-сайте.На первой странице я должен извлечь таблицу, затем на следующей, изменить страницу и извлечь вторую таблицу, которая появляется, и так далее ...

Я не могу найти css или xpath, который позволяет мнеменять страницы.Я попробовал несколько CSS ниже:

“button.a-Button.a-IRR-button.a-IRR-button—pagination”

“li.a-IRR-pagination-item”

Вот краткая сводка моего кода

library(rvest)

library(xml2)

 u<-"http://transparencia.pi.gov.br/apex/f?p=101:SERVIDORES::::::"

 ht<-read_html(u) %>%

  html_nodes("span.a-Icon.icon-right-chevron") %>%

  html_nodes("table") %>%

  html_table()

ht

## Или

ht<-html_session(u) %>%

  follow_link("span.a-Icon.icon-right-chevron") %>%

  html_nodes("table") %>%

  html_table()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...