UTF-8 серверная конвертация из euc-kr в корейский язык теряет около 15% символов - PullRequest
2 голосов
/ 02 февраля 2012

Во время конвертации в UTF8 на сервере некоторые корейцы не конвертируют правильно (например, 15% символов).

С сервера мы получаем символы в формате euc-kr.

Текущий сценарий:

public static String decodeString(String encoded) {
        if (encoded == null) {
            encoded = "";
        } else if (encoded.equalsIgnoreCase("null")) {
            encoded = "";
        } else if (encoded.equalsIgnoreCase("true")) {
            encoded = "true";
        } else if (encoded.equalsIgnoreCase("false")) {
            encoded = "false";
        } else {
            encoded = new String(Base64.decode(encoded, Base64.DEFAULT));

        }
        return encoded;
    } 

Сервер: EUCKR корейские данные-> преобразовать в UTF8 -> кодировать base64 -> отправить клиенту

На нашей стороне:

Клиент: получить кодированный в base64 контент -> декодировать base 64 -> отображать UTF8

Однако во время преобразования в UTF8 на сервере некоторые корейцы не выполняют правильное преобразование (например, 15% символов).

Например, для текста 에디10

при выполнении кодировки euckr -> base64

, но при выполнении euckr -> utf8 -> base64,: (это обрезает строку посередине)

Требуется увидетьесли приложение может обрабатывать отображение формата euckr напрямую.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...