Я обрабатываю данные SPSS из анкеты, которая должна быть создана в M $ Word.Word автоматически превращает дефисы в длинные дефисы и преобразуется в символы, которые не отображаются должным образом, то есть «-» превращается в «ú».
Мой вопрос: что эквивалентно utf8ToInt ()в наборе символов WINDOWS-1252?
utf8ToInt("A")
[1] 65
Когда я делаю это с моими собственными данными, я получаю сообщение об ошибке:
x <- str_sub(levels(sd$j1)[1], 7, 7)
print(x)
[1] "ú"
utf8ToInt(x)
Error in utf8ToInt(x) : invalid UTF-8 string
Однако содержимое xотлично подходит для выражений grep и gsub.
> Sys.getlocale()
[1] "LC_COLLATE=English_United Kingdom.1252;LC_CTYPE=English_United Kingdom.1252;LC_MONETARY=English_United Kingdom.1252;LC_NUMERIC=C;LC_TIME=English_United Kingdom.1252"