R: файл документа uplad с readtext () с польскими символами - PullRequest
0 голосов
/ 21 апреля 2019

Давайте создадим файл .doc (DOC, а не DOCX !!!), содержащий следующее предложение на польском языке:

"Na każde 40 mg% powyżej 100 mg% dodać 1j NovoRapidu, przy glikemii poniżej 100 mg% odjąć1j NovoRapidu od dawki wyliczonej na WW w posiłku głównym. Przekąski liczyć 1j / 1WW. W przypadku hiperglikemii prze snem, tj. Ok. Godz. 22.00, переход на новую версию 1j 100% -ый процентный процент: 100% от 100% процентных ставок: 100% от 100% процентов на 100%.*

Вы также можете загрузить файл документации (my_doc.doc) из ЗДЕСЬ

Я хочу загрузить этот вектор символов в R с помощью кода:

library(readtext)
path <- "path of the my_doc.doc"
Sys.setlocale("LC_CTYPE", "polish")
i <- readtext(path,encoding = "UTF-8")
#or
i <- readtext(path)
i$text

#[1] "Na ka?de 40 mg% powy?ej 100 mg% doda? 1j NovoRapidu, przy  glikemii  #poni?ej\r\n100 mg% odj?? 1j NovoRapidu od dawki wyliczonej na  WW  w  posi?#ku  g?ównym.\r\nPrzek?ski liczy? 1j/ 1WW. W przypadku  hiperglikemii  przed  #snem,  tj.  ok.\r\ngodz. 22.00, prosz? liczy? na zbicie 1j NovoRapidu na ka?#de 50  mg%  powy?ej\r\n150 mg%."

Код дает одинаковый вывод независимо от используемой кодировки.Я хочу получить один и тот же текст в файле .doc и R. Я использую Windows.Как мне отредактировать мой код?

...