Question

Может быть, кто-то может помочь мне в извлечении веб-данных.

Цель: извлечь из каждой страницы появившуюся таблицу.

Моя проблема: я не могу найти правильный css, который позволяет мнепоставить кнопку «Далее» изменения страницы, которая появляется на веб-сайте.На первой странице я должен извлечь таблицу, затем на следующей, изменить страницу и извлечь вторую таблицу, которая появляется, и так далее ...

Я не могу найти css или xpath, который позволяет мнеменять страницы.Я попробовал несколько CSS ниже:

“button.a-Button.a-IRR-button.a-IRR-button—pagination”

“li.a-IRR-pagination-item”

Вот краткая сводка моего кода

library(rvest)

library(xml2)

 u<-"http://transparencia.pi.gov.br/apex/f?p=101:SERVIDORES::::::"

 ht<-read_html(u) %>%

  html_nodes("span.a-Icon.icon-right-chevron") %>%

  html_nodes("table") %>%

  html_table()

ht

## Или

ht<-html_session(u) %>%

  follow_link("span.a-Icon.icon-right-chevron") %>%

  html_nodes("table") %>%

  html_table()

Извлечение HTML-данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Извлечение HTML-данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов