При кодировании строки Java в Latin-1 (т. Е. Кодировка ISO-8859-1) в настоящее время я преобразовываю немецкий символ β ('\ u03B2') в ß ('\ u00DF') перед выполнением кодирования. Я пытаюсь избежать вопросительного знака в кодировке, где это возможно.
Может кто-нибудь предложить другие не кодируемые символы, которые можно заменить кодируемыми? Или, еще лучше, библиотека Java, которая делает это для меня?
Обновление:
Немного предыстории: у меня есть Java-программа, которая экспортирует свои данные в файлы CSV, чтобы их можно было прочитать в стороннем приложении. Клиент пожаловался, что некоторые символы не конвертированы - он привел мне пример «straβe». Хотя технически β является греческим символом бета-версии, быстрый поиск в Google показывает, что довольно много людей используют его для обозначения ß.