У меня есть RSelenium
скрипт:
library(tidyverse)
library(RSelenium) # running through docker
library(rvest)
library(httr)
remDr <- remoteDriver(port = 4445L, browserName = "chrome")
remDr$open()
remDr$navigate("https://books.google.com/")
books <- remDr$findElement(using = "css", "[name = 'q']")
books$sendKeysToElement(list("NHL teams", key = "enter"))
bookElem <- remDr$findElements(using = "xpath",
"//h3[@class = 'LC20lb']//parent::a")
links <- sapply(bookElem, function(bookElem){
bookElem$getElementAttribute("href")
})
Приведенные выше ссылки переходят по каждой ссылке в результатах поиска Google (их 10 на страницу). Книги, которые я ищу, в основном имеют предварительный просмотр, когда вы нажимаете на них. Если есть предварительный просмотр, есть небольшая ссылка About this book
, по которой можно перейти к информации о публикации.
Я хочу нажать на первые ссылки, а затем, если есть предварительный просмотр, нажать «Об этой книге». У меня есть ниже, но я просто получаю Error: object of type 'closure' is not subsettable
ошибок:
for(link in links) {
# Navigate to each link
remDr$navigate(link)
# If statement to get past book previews
if (str_detect(link, "frontcover")) {
link2 <- remDr$findElement(using = 'xpath',
'//*[@id="sidebar-atblink"]//parent::a')
link2 <- as.list(link2)
print(class(link2))
link2_about <- sapply(link2, function(ugh){
ugh$getElementAttribute('href')
})
} else {
print("nice going, dumbass")
}
}
Или я пытаюсь использовать for
цикл вместо sapply
, получаю Error: $ operator is invalid for atomic vectors
:
for(link in links) {
# Navigate to each link
remDr$navigate(link)
# If statement to get past book previews
if (str_detect(link, "frontcover")) {
link2 <- remDr$findElement(using = 'xpath',
'//a[@id="sidebar-atb-link" and span[.="About this book"]]')
for(i in length(link2)){
i$getElementAttribute('href')
}
} else {
print("dumbass")
}
}
Как я могу успешно нажать на эту вторую ссылку, в зависимости от того, есть ли предварительный просмотр? Спасибо!