Я хочу взять количество страниц с веб-сайта. Я пытаюсь сделать это как на учебник . Я использовал эту функцию:
get_last_page <- function(html){
pages_data <- html %>%
# The '.' indicates the class
html_nodes('.pagination-page') %>%
# Extract the raw text as a list
html_text()
# The second to last of the buttons is the one
pages_data[(length(pages_data)-1)] %>%
# Take the raw string
unname() %>%
# Convert to number
as.numeric()
}
first_page <- read_html(url)
(latest_page_number <- get_last_page(first_page))
для веб-сайта
url <-'http://www.trustpilot.com/review/www.amazon.com'
работает нормально. Когда я пытался сделать это с
url <-'https://energybase.ru/en/oil-gas-field/index'
, я получил целое число (0).
Я изменил
html_nodes('.pagination-page')
на
html_nodes('.html_nodes('data-page')')
И не удалось. Как я могу изменить свой код, чтобы он работал нормально?