Я хотел бы загрузить все изображения с этого сайта , но после загрузки фотографий все повреждено.Что я должен сделать, чтобы загрузить их успешно?
Мой код:
library(XML) dir.create('c:/photos') urls<-paste("http://thedevilsguard.tumblr.com/page/",1:1870,sep="") doc<-htmlParse(urls[1]) links<-unique(unlist(xpathApply(doc,'//div[@class="timestamp"]/a',xmlGetAttr,'href'))) for (i in 1:length(links)){ doc2<-htmlParse(links[i]) link<-xpathApply(doc2,'//div[@class="centre photopage"]//p//img',xmlGetAttr,'src')[[1]][1] download.file(link,paste("C:/photos/",basename(link),"")) }
Похоже, вы находитесь под Windows.Когда вы загружаете двоичные файлы, вы должны указать режим, который будет двоичным, например,
download.file(link, ..., mode = 'wb')
см. ?download.file для получения подробной информации.
?download.file
Сначала попробуйте и скачайте один. Сделайте это:
link = "http://29.media.tumblr.com/tumblr_m0q2g8mhGK1qk6uvyo1_500.png" download.file(link,basename(link))
Это работает?
Я заметил, что это PNG, а не JPEG, поэтому, возможно, вы пытаетесь прочитать его как JPEG.