Умлауты в R отображаются некорректно - PullRequest
0 голосов
/ 04 мая 2018

Я пытаюсь использовать несколько источников немецких / швейцарских данных с умлаутами в нем. При попытке слияния я понял, что умляуты не отображаются корректно в R и одни и те же имена отображаются в разных файлах по-разному.

map <-readOGR("/path/to/data.gdb", layer = "layer")
map@data$name
# [1] L\303\266rrach
# [2] Karlsruhe
# [3] ...

Наряду с несколькими другими постами я читаю Кодирование немецких умлаутов при использовании readOGR , потому что одним из моих источников данных является файл shp, который я читаю с readOGR.

Добавление use_iconv = TRUE, encoding = "UTF-8") к концу readOGR не помогло. И проблема существует за пределами использования redOGR. Я видел, что использование Sys.setlocale() и локаль, которая поддерживает UTF-8, сработало для этого автора, но я не знаю, что это значит после просмотра информации ?Sys.setlocale.

Как правильно читать на немецком языке данные в R на Mac, используя английский? Sys.getlocale сообщает C.

1 Ответ

0 голосов
/ 04 мая 2018

Не могли бы вы как-нибудь включить примерный .gdb-файл?

Что произойдет, если вы попробуете encoding="latin1"?

Может быть, данные GDB были сохранены в неправильной кодировке? Вы создаете это сами или скачали откуда-то?

Вы также можете проверить информацию о gdb-файле с помощью этой команды:

ogrinfo -al "/path/to/data.gdb"
...