Буквы кириллицы, закодированные неправильно с использованием model.matrix - PullRequest
0 голосов
/ 01 июля 2019

У меня есть фрейм данных, содержащий буквы кириллицы (русские) в именах столбцов и значениях, которые необходимо преобразовать с помощью model.matrix.

model.matrix преобразует эти переменные в символы Юникода, такие как. Есть ли способ конвертировать их обратно или вообще избежать конверсии?

library(tibble)
x <- tribble(~"тест", ~value1, ~value2,
         "тест", 5, 10,
         "тест2", 6, 11)
m <- model.matrix(value1 ~ ., data = x)

Ожидаемый результат - модель.matrix, содержащая символы в UTF-8 в том виде, в котором они должны быть.

1 Ответ

0 голосов
/ 02 июля 2019

Проблема была решена с помощью stringi:

library(stringi)
colnames(m) <- stri_unescape_unicode(gsub("<U\\+(....)>",
                                    "\\\\u\\1",
                                    colnames(m)))
...