rvest dowload фига из web xpath, в то время как Chrome не работает, почему это в главе XML-документа будет работать? - PullRequest
0 голосов
/ 28 апреля 2019

Я хочу скачать изображение с URL: target fig link xpath in chrome https://tophatter.com/lots/104461372

для извлечения:

https://images.tophatter.com/42c09f609e7a6a47c70e0e1ccf3a0bb6/large.jpg

пока xpath не работал: div [class = 'col-md-7 slot-images'] img

в браузере Chrome> проверка> щелкните большой рис., Путь Xpath показан на: // * [@ id = "lot-modal-content"] / div 1 / img

это в xml части тела, не работает в учебнике по rvest

library(rvest)
library(downloader)
library(dplyr)

url <- "https://tophatter.com/lots/104461372"
doc <- read_html(url)
doc <- xml2::read_html(url)

doc %>% html_nodes("div.col-md-7") %>% html_attr("class")
doc %>% html_nodes("div.col-md-7") %>% html_attr("src")

ниже возвращается 'col-md-7 slot-images' NA

1 Ответ

0 голосов
/ 28 апреля 2019

здесь мое решение, после следа и ошибки я нашел целевой jpg url в головной части

a = doc %>% html_nodes("meta") %>% html_attrs
a = doc %>% html_nodes("meta") %>% html_attr("content") %>% na.omit
index = a %>% stringr::str_detect(".jpg") %>% which
a[index]

снимок экрана результатов

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...