Я читаю файл через RJDBC из базы данных MySQL, и он правильно отображает все буквы в R (например, נווה שאנן).
Однако даже при экспорте с использованием write.csv и fileEncoding = "UTF-8" вывод выглядит следующим образом
<U+0436>.<U+043A>. <U+041B><U+043E><U+0437><U+0435><U+043D><U+0435><U+0446>
(в данном случае это не строка выше, а болгарская) для болгарского, иврита, китайского и так далее. Другие специальные символы, такие как ã, ç и т. Д., Работают нормально.
Я подозреваю, что это из-за спецификации UTF-8, но я не нашел решения в сети
Моя ОС - немецкая Windows7.
редактировать: я пытался
con<-file("file.csv",encoding="UTF-8")
write.csv(x,con,row.names=FALSE)
и (afaik) эквивалент write.csv(x, file="file.csv",fileEncoding="UTF-8",row.names=FALSE)
.