Я очистил изображение следующим образом:
library(rvest)
library(magrittr)
url = 'http://x.yupoo.com/photos/05941188/albums'
web = read_html(url)
Теперь мне нужно рассмотреть узлы.Я выберу функцию extract2()
, чтобы выбрать точные узлы:
gianni = html_nodes (web, '.showindex__gallerycardwrap')
ugo = gianni %>% extract2(1) %>% html_nodes('img') %>% html_attr('src')
Теперь я загружаю изображения.Я делаю это с помощью функции download.file
, которая требует от меня создания нового объекта protocol
, чтобы получить полную строку URL:
protocol = 'http:'
scarica = download.file(paste0(url,ugo[1], destfile = 'imm.jpg', method = 'wininet')
Когда я вижу изображение, оно выглядит такчто явно не то, что я ожидал с точки зрения качества:
![web scrape img gianni](https://i.stack.imgur.com/NUuoJ.png)