Я использую gdscrapeR
для извлечения обзоров Glassdoor. Но я не могу пройти мимо самого первого кода в gdscrapeR
:
library(gdscrapeR)
df <- get_reviews(companyNum = "E40371")
Number of web pages to scrape:
StartingError in 1:maxResults : argument of length 0
Я зашел в блог создателя здесь . В блоге представлена разбивка функции get_reviews
. Я думаю, что проблема здесь:
totalReviews <- read_html(paste(baseurl, companyNum, sort, sep = "")) %>%
html_nodes(".tightVert.floatLt strong, .margRtSm.minor") %>%
html_text() %>%
sub("Found | reviews", "", .) %>%
sub(",", "", .) %>%
as.integer()
maxResults <- as.integer(ceiling(totalReviews/10)) #10 reviews per page, round up to whole number
Я не знаю, что мне нужно сделать, чтобы исправить эту проблему. Я просто хочу извлечь обзоры Glassdoor. Пожалуйста, помогите!