RSelenium: переход по ссылке в другой ссылке - PullRequest
0 голосов
/ 22 марта 2019

У меня есть RSelenium скрипт:

library(tidyverse)
library(RSelenium) # running through docker
library(rvest)
library(httr)

remDr <- remoteDriver(port = 4445L, browserName = "chrome")
remDr$open()


remDr$navigate("https://books.google.com/")
books <- remDr$findElement(using = "css", "[name = 'q']")

books$sendKeysToElement(list("NHL teams", key = "enter"))

bookElem <- remDr$findElements(using = "xpath",
                               "//h3[@class = 'LC20lb']//parent::a")

links <- sapply(bookElem, function(bookElem){
  bookElem$getElementAttribute("href")
})

Приведенные выше ссылки переходят по каждой ссылке в результатах поиска Google (их 10 на страницу). Книги, которые я ищу, в основном имеют предварительный просмотр, когда вы нажимаете на них. Если есть предварительный просмотр, есть небольшая ссылка About this book, по которой можно перейти к информации о публикации.

Я хочу нажать на первые ссылки, а затем, если есть предварительный просмотр, нажать «Об этой книге». У меня есть ниже, но я просто получаю Error: object of type 'closure' is not subsettable ошибок:

for(link in links) {

  # Navigate to each link
  remDr$navigate(link)

  # If statement to get past book previews
  if (str_detect(link, "frontcover")) {

   link2 <- remDr$findElement(using = 'xpath', 
                               '//*[@id="sidebar-atblink"]//parent::a')
   link2 <- as.list(link2)
   print(class(link2))
   link2_about <- sapply(link2, function(ugh){
      ugh$getElementAttribute('href')
    })

  } else {
    print("nice going, dumbass")
  }
}

Или я пытаюсь использовать for цикл вместо sapply, получаю Error: $ operator is invalid for atomic vectors:

for(link in links) {

  # Navigate to each link
  remDr$navigate(link)

  # If statement to get past book previews
  if (str_detect(link, "frontcover")) {

    link2 <- remDr$findElement(using = 'xpath',
       '//a[@id="sidebar-atb-link" and span[.="About this book"]]')

     for(i in length(link2)){
      i$getElementAttribute('href')
     }

    } else {
     print("dumbass")
   }
}

Как я могу успешно нажать на эту вторую ссылку, в зависимости от того, есть ли предварительный просмотр? Спасибо!

1 Ответ

1 голос
/ 22 марта 2019

Просто обновите строку ниже.

aboutLinks <- remDr$findElements(using = 'xpath', 
                           '//a[@id="sidebar-atb-link" and span[.="About this book"]]')
links2 <- sapply(aboutLinks, function(about_link){
  about_link$getElementAttribute('href')
})
...