Я использовал pdf_text для чтения pdf-файла и разделения для создания их в таблице. Это мой код и результат (в моем языке много символов вместо некоторых символов): result
> txt14_16 <- pdf_text(".pdf")
> data<-(txt14_16[100])
> df <- data %>%
read_lines()%>%
grep('^\\s{5}\\w|^\\s{1}\\w',., value = TRUE)
> out <- data.table(do.call( rbind, strsplit( df, '\\s{3,}' ) ))
Я пытался использовать этот код
out1<-out%>%
stri_replace_all_regex("<U\\+([[:alnum:]]+)>", "\\\\u$1") %>%
stri_unescape_unicode() %>%
stri_enc_toutf8()
, и это было хорошо (все результаты на моем языке появятся в результате R без )в списке как результат, но я не могу экспортировать их в Excel, текст, CSV.Когда я их экспортирую, они появятся с
Итак, я хочу экспортировать их в Excel без .