Давайте создадим файл .doc (DOC, а не DOCX !!!), содержащий следующее предложение на польском языке:
"Na każde 40 mg% powyżej 100 mg% dodać 1j NovoRapidu, przy glikemii poniżej 100 mg% odjąć1j NovoRapidu od dawki wyliczonej na WW w posiłku głównym. Przekąski liczyć 1j / 1WW. W przypadku hiperglikemii prze snem, tj. Ok. Godz. 22.00, переход на новую версию 1j 100% -ый процентный процент: 100% от 100% процентных ставок: 100% от 100% процентов на 100%.*
Вы также можете загрузить файл документации (my_doc.doc) из ЗДЕСЬ
Я хочу загрузить этот вектор символов в R с помощью кода:
library(readtext)
path <- "path of the my_doc.doc"
Sys.setlocale("LC_CTYPE", "polish")
i <- readtext(path,encoding = "UTF-8")
#or
i <- readtext(path)
i$text
#[1] "Na ka?de 40 mg% powy?ej 100 mg% doda? 1j NovoRapidu, przy glikemii #poni?ej\r\n100 mg% odj?? 1j NovoRapidu od dawki wyliczonej na WW w posi?#ku g?ównym.\r\nPrzek?ski liczy? 1j/ 1WW. W przypadku hiperglikemii przed #snem, tj. ok.\r\ngodz. 22.00, prosz? liczy? na zbicie 1j NovoRapidu na ka?#de 50 mg% powy?ej\r\n150 mg%."
Код дает одинаковый вывод независимо от используемой кодировки.Я хочу получить один и тот же текст в файле .doc и R. Я использую Windows.Как мне отредактировать мой код?