Загрузите .pdf файл в R, получая сообщение об ошибке - PullRequest
0 голосов
/ 16 марта 2019

У меня проблемы с загрузкой .pdf из Интернета в Rstudio. Я хотел бы проанализировать .pdf, используя пакет pdftools. У меня есть каталог с именем files, в который я хочу зайти .pdf. Я использую этот код.

download.file('https://www2.gov.scot/Resource/Doc/352649/0118638.pdf', 'files')

Я получаю эту ошибку:

Warning messages:
1: In download.file("https://www2.gov.scot/Resource/Doc/352649/0118638.pdf",  :
  URL https://www2.gov.scot/Resource/Doc/352649/0118638.pdf: cannot open destfile 'files', reason 'Is a directory'
2: In download.file("https://www2.gov.scot/Resource/Doc/352649/0118638.pdf",  :
  download had nonzero exit status

Есть ли способ обойти это сообщение?

Ответы [ 2 ]

2 голосов
/ 16 марта 2019

destfile должно быть именем файла (, а не именем каталога ) для загруженного файла.

Например, если бы мы скачали файл выше и сохранили его как «Commission.pdf» в папке files, мы бы сделали следующее:

download.file(url='https://www2.gov.scot/Resource/Doc/352649/0118638.pdf',
 destfile="files/Commission.pdf")

Вы передаете file в destfile, что заставляет R выдать предупреждение об ошибке, что указанный вами аргумент является каталогом .

0 голосов
/ 16 марта 2019

Вы пропустили назначение функции.Это

download.file(url, destfile, ...)

Поэтому, когда вы используете download.file('https://www2.gov.scot/Resource/Doc/352649/0118638.pdf', 'files'), вы скачиваете файл https://www2.gov.scot/Resource/Doc/352649/0118638.pdf и сохраняете его с именем files.

Что вам нужноdo - изменить второй аргумент, чтобы включить полный путь к файлу.Это может быть что-то вроде этого:

download.file('https://www2.gov.scot/Resource/Doc/352649/0118638.pdf', 'files/0118638.pdf')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...