Проблемы с загрузкой PDF-файла с использованием R - PullRequest
14 голосов
/ 14 февраля 2012

Я хотел бы скачать PDF-файл из Интернета и сохранить его на локальном HD. После загрузки выходной файл PDF содержит много пустых страниц. Что я могу сделать, чтобы это исправить?

Пример:

require(XML)
url <- ('http://cran.r-project.org/doc/manuals/R-intro.pdf')
download.file(url, 'introductionToR.pdf')

Заранее спасибо.

Ответы [ 2 ]

30 голосов
/ 14 февраля 2012

Попробуйте использовать wb-режим следующим образом:

download.file(url, 'introductionToR.pdf', mode="wb").

Для меня это так работает.

0 голосов
/ 07 марта 2017

Вы можете загрузить PDF-файлы и экспортировать таблицы в виде data.frame, используя пакет tabulizer

https://ropensci.org/tutorials/tabulizer_tutorial.html

install.packages("devtools")
# on 64-bit Windows
ghit::install_github(c("ropenscilabs/tabulizerjars", "ropenscilabs/tabulizer"), INSTALL_opts = "--no-multiarch")
# elsewhere
ghit::install_github(c("ropenscilabs/tabulizerjars", "ropenscilabs/tabulizer"))

library(tabulizer)

f2 <- "https://github.com/leeper/tabulizer/raw/master/inst/examples/data.pdf"
extract_tables(f2, pages = 1, method = "data.frame")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...