R: pdfscrapping больших файлов PDF с пакетом pdftools - PullRequest
0 голосов
/ 04 января 2019

- использовать упакованные «pdftools» для удаления данных из PDF-файлов. Однако, когда я сталкиваюсь с файлом .pdf размером> 1 МБ, я должен долго ждать, пока R загрузит текст (например, ~ 4,5 МБ, около 5 минут). Я только что получил несколько команд ошибки:

"Ошибка PDF: нет текущей точки в ближнем пути"

Что мне делать, чтобы улучшить время загрузки? Любой другой пакет, чтобы сделать это быстро?

...