Я пытаюсь извлечь одно значение поля данных из PDF и поместить результат в CSV.Мой результат извлечения показывает одно и то же значение дважды, поскольку поле данных дважды отображается в файле PDF, и я хотел бы заблокировать их, чтобы их можно было извлечь один раз.Как структурировать мои командные строки (в цикле), чтобы значение извлекалось один раз?Большое спасибо за помощь
Ниже мой код:
txta<-list.files("N:\\3E Montreal\\Operational Support Team\\Rod\\SampleFlashPoint09062018\\Text",pattern = ".txt$",full.names = TRUE,recursive = FALSE)
help("list.files")
head(txta)
lst<-vector("list",length(txta))
head(lst)
names(lst)<-txta
for (i in 1:length(txta)){
doc<-readLines(txta[i])
doc<-doc[grepl("Flash point",doc)]
lst[[txta[[i]]]]<-doc %>% stringr::str_extract("(\\d|>).*")
resultsss<-paste(txta[i],lst[[txta[[i]]]])
write.table(resultsss,file = "newhenkelfp1.csv",row.names = FALSE,col.names = FALSE,sep = ",", append = TRUE)
}
Спасибо