Символ замены Юникода - PullRequest
0 голосов
/ 28 июля 2011

Как избежать замены символа юникода для расширенных символов ASCII при сбое кодирования UTF-8?

Есть ли способ сохранить расширенные символы ASCII, избегая кодировки Unicode в Java?

Ответы [ 2 ]

4 голосов
/ 28 июля 2011

Кодировка Данные Unicode в UTF-8 не могут завершиться ошибкой . Все Символы Unicode могут быть закодированы в UTF-8, поэтому нет условий сбоя (кроме, возможно, нехватки памяти или подобных вещей).

Если вы декодируете UTF-8, то может произойти сбой, когда на самом деле ввод не UTF-8.В этом случае попытка декодировать его с помощью UTF-8 - неправильный подход, и нет способа «исправить UTF-8», чтобы сделать правильную вещь: вы должны выбрать правильную кодировку.

Не могли бы вы предоставить некоторыеПример ввода и кода, чтобы продемонстрировать, что именно точно , у вас проблемы?

0 голосов
/ 28 июля 2011

Нет никаких причин избегать кодировки Unicode.Актуальные проблемы приходят с плохими старыми кодировками.

Конвертируйте все ваши файлы в UTF-8 и запустите ваше приложение с системным свойством file.encoding, установленным в UTF-8.

java -Dfile.encoding=UTF-8

Предоставьте дополнительную информацию о вашем контексте, если вы хотите получить более подробный ответ.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...