Как устранить ошибку обработки нескольких файлов PDF в сценарии R - PullRequest
0 голосов
/ 24 октября 2018
library(readtext)
data_dir <- system.file("E:/project_refrences", package = "readtext")
rt7 <- readtext(paste0(data_dir, "*.pdf"), docvarsfrom = "filenames", 
                 docvarnames = c("document", "language"))

Я пытался получить эту ошибку при обработке нескольких файлов PDF:

## PDF error: xref num 65 not found but needed, try to reconstruct<0a>
## PDF error: Invalid Font Weight
## PDF error: Invalid Font Weight
## PDF error: Invalid Font Weight
## PDF error: Invalid Font Weight
## PDF error: Invalid Font Weight

Я также пытался применить цикл for:

pdf <- Sys.glob("*.pdf")
for(i in pdf){
    rt <- readtext((i), docvarfrom = "filenames", docvarnames = c("document", "language"))}

, ноПолучение такой же вышеупомянутой ошибки.
Как я могу исправить эту ошибку или обойти ее?

...