Неизвестные уровни в `f`: ошибка fct_recode, связанная с форматированием апострофа - PullRequest
0 голосов
/ 26 апреля 2018

Я пытаюсь использовать команду fct_recode() из пакета forcats для перемаркировки всех наблюдений в столбце одного кадра данных для слияния с другим кадром данных. Столбец, который я записывал, представлял собой список названий стран из набора данных ООН. Я привел это к фактору, а затем перекодировал его, но для одного из названий стран я получил ошибку:

Неизвестные уровни в f: Корея, Дем. Народный представитель.

Кажется, он не распознает апостроф в названии страны. Я использовал команды anti_join() и unique(), чтобы найти, какие записи не совпадают, и даже скопировал и вставил название «Корея, Дем. Народная Республика». к fct_recode выдал такую ​​же ошибку. Похоже, это относится к форматированию апострофа, о чем свидетельствует различие в следующих строках кода:

undata <- mutate(undata, country_name=as.factor(country_name))
undata <- mutate(undata, country_name=fct_recode(country_name, 
                                 "Korea_North"="Korea, Dem. People's Rep."))
# versus
undata <- mutate(undata, country_name=fct_recode(country_name, 
                                  "Korea_North"="Korea, Dem. People’s Rep."))`

Копирование и вставка любого из этих, казалось бы, по-разному отформатированных апострофов приводит к одной и той же ошибке.

Я не уверен, как перекодировать его с «правильным» апострофом.

Я использую версию 3.4.3 R для Windows 10 и tidyverse 1.2.1.

...