Проблема с кодировкой ByteArrayOutputStream - PullRequest
1 голос
/ 08 апреля 2011

У меня проблема с кодировкой, после того как я скачал данные RSS-канала с веб-сайта.Какой-то персонаж неправильно интерпретирует.Я использую HttpResponse.getEntity () и помещаю в цикл чтение inputStream и пишу в ByteArrayOutPutStream.

Например, ByteArrayOutPutStream bs;после записи в «bs» я использую String test = bs.toString («UTF-8»);

однако некоторые символы выглядят так:»Ç³ »çµ ± ä¸äºéç ¥ å® ¢ æ¶

Я не могу преобразовать этот персонаж, любая идея.

Спасибо

1 Ответ

4 голосов
/ 08 апреля 2011

Это не кодировка UTF-8, скорее всего, кодировка Big5 (история ваших вопросов подтверждает, что вы из Китая / Гонконга).

Mytest 簿 翹 癡 職 疇 繡6 簿 翹 疇 簣 癡 瞽 竄 癡 穠 穠 穠 100 100 100 罈 疇 疇 100 100 100 1001008 * Вы должны быть в состоянии определить это, прочитав HttpEntity#getContentType() самостоятельно.Он должен вернуть что-то вроде

text/html;charset=Big5
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...