Как вставить в другой каталог, используя pdftotext.exe в R studio? - PullRequest
0 голосов
/ 31 октября 2018

Это мой код для преобразования .pdf в файл .txt с целью анализа текста. Обратите внимание, что я использовал pdftotext.exe для преобразования .pdf в .txt файл.

dest <-"C:/Users/Unimas/Documents/R/Converted into text file/all files"
pdffiles <- list.files(path = dest, pattern = "pdf",  full.names = TRUE)
test <- lapply(pdffiles, function(i) system(paste('"D:/External_Software/XpdfReader-win64/xpdf-tools-win-4.00/bin64/pdftotext.exe"', 
                                     paste0('"', i, '"')), wait = FALSE) )

Проблема в том, что я хотел изменить преобразованный файл .txt в другой каталог. Как это сделать?

Ваша помощь очень ценится!

1 Ответ

0 голосов
/ 31 октября 2018

Попробуй так:

library(tools)
src <-"C:/source/dir"
pdffiles <- list.files(path = src, pattern = "pdf",  full.names = TRUE)
test <- lapply(pdffiles, function(i) system(paste('"pdftotext.exe"', 
paste0('"', i, '"'), paste0('"C:/path/to/some/out/folder/', basename(file_path_sans_ext(i)), '.txt"')), wait = FALSE) )

Объяснение

  • выходной файл перемещается напрямую через второй параметр pdftotext
  • путь и расширение удаляются из имени входного файла с использованием basename и tools::file_path_sans_ext, к папке назначения добавляется префикс и .txt" добавляется
  • вы можете добавить pdftotext.exe в вашу систему PATH
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...