Ужасное качество на веб-скребке изображения с использованием rvest - PullRequest
0 голосов
/ 01 декабря 2018

Я очистил изображение следующим образом:

library(rvest)
library(magrittr)
url = 'http://x.yupoo.com/photos/05941188/albums'
web = read_html(url)

Теперь мне нужно рассмотреть узлы.Я выберу функцию extract2(), чтобы выбрать точные узлы:

gianni = html_nodes (web, '.showindex__gallerycardwrap')
ugo = gianni %>%  extract2(1) %>%  html_nodes('img') %>%  html_attr('src')

Теперь я загружаю изображения.Я делаю это с помощью функции download.file, которая требует от меня создания нового объекта protocol, чтобы получить полную строку URL:

protocol = 'http:'
scarica = download.file(paste0(url,ugo[1], destfile = 'imm.jpg', method = 'wininet')

Когда я вижу изображение, оно выглядит такчто явно не то, что я ожидал с точки зрения качества:

web scrape img gianni

1 Ответ

0 голосов
/ 05 декабря 2018

Вместо создания ссылки с помощью "URL", создание с помощью "http:" помогает мне:

download.file(paste0("http:",ugo[1]),destfile = "imm.jpg", method = 'wininet',mode='wb')

изображение лучшего качества

...