Unicode-символы в фрейме R - PullRequest
0 голосов
/ 10 июля 2019

У меня есть фрейм данных, который содержит полированные диакритические знаки, однако в моем фрейме данных они представлены, например, как ZESP\xc3\x93\xc5\x81 SZK\xc3\x93\xc5\x81, который должен быть ZESPÓŁ SZKÓŁ. Я пытался заменить все эти символы: например

x <- "SP\\xc3\\x93\\xc5\\x81KA"
x1 <- data.frame(x)

data <- data.frame(lapply(x1, function(df3) {
                    gsub("SP\\xc3\\x93\\xc5\\x81KA", "SPÓŁKA", df3)
              }))

Однако такая замена не работает. Как бороться с этими типами кадров данных? Как заставить его отображать правильные диакритические знаки?

Я добавил полностью воспроизводимый пример. Есть идеи?

...