Это может быть несколько способов, в зависимости от фактической проблемы:
A :
Если исходные данные (например, csv-файл и т. Д.)) выглядит хорошо, и вы видите только плохую кодировку в R, вы должны попытаться прочитать файл с правильной кодировкой - большинство функций чтения и записи принимают параметр для этого, и UTF-8 должен работать в большинстве случаев.Вы можете, например, попробовать read.csv(your_file_path, fileEncoding='UTF-8')
или аналогичный (в зависимости от того, как вы читаете ваши данные.)
B :
Данные фактически повреждены (то есть кто-торанее испортили кодировку, и вы не виноваты в том, что прочитали ее неправильно), и теперь вы хотите исправить ее вручную (всего на пару символов, например, ä, ö, ü, ß.)
Затем, используяdplyr
пакет, который вы могли бы:
сделать функцию, которая исправляет ошибки:
my_fun <- function(str){
str <- gsub("ü", "ü", str)
str <- gsub("ä", "ä", str)
< additional steps >
str
}
Применитьэто к каждому символьному столбцу вашего фрейма данных:
df %>% mutate_if(is.character, my_function)