В таблице экспорта в Excel есть строка <U + F70A> и тайская строка в r - PullRequest
0 голосов
/ 04 марта 2019

Я использовал pdf_text для чтения pdf-файла и разделения для создания их в таблице. Это мой код и результат (в моем языке много символов вместо некоторых символов): result

> txt14_16 <- pdf_text(".pdf") 

> data<-(txt14_16[100]) 
> df <- data %>% 
  read_lines()%>% 
  grep('^\\s{5}\\w|^\\s{1}\\w',., value = TRUE)  
> out <- data.table(do.call( rbind, strsplit( df, '\\s{3,}' ) ))

Я пытался использовать этот код

out1<-out%>%
stri_replace_all_regex("<U\\+([[:alnum:]]+)>", "\\\\u$1") %>% 
stri_unescape_unicode() %>% 
stri_enc_toutf8()

, и это было хорошо (все результаты на моем языке появятся в результате R без )в списке как результат, но я не могу экспортировать их в Excel, текст, CSV.Когда я их экспортирую, они появятся с

Итак, я хочу экспортировать их в Excel без .

...