SAXException при разборе символа "°" - PullRequest
0 голосов
/ 09 декабря 2011

У меня проблемы с созданным мной парсером RSS-каналов, основанным на SAXParser. Я расширил класс DefaultHandler, и до сегодняшнего дня все работало нормально; Теперь у меня проблемы, потому что файл фида содержит следующую строку:

<description>°</description>

Итак, я получаю исключение, описанное так:

org.apache.harmony.xml.ExpatParser$ParseException: At line 102, column 13: not well-formed (invalid token) 

Как я мог исправить эту ситуацию? Что я должен сделать, чтобы избежать этого исключения?

1 Ответ

0 голосов
/ 09 декабря 2011

Статья здесь предлагает вам правильно установить кодировку на вашем входном источнике. Фрагмент из статьи дает следующее решение, используя соответствующую кодировку для ваших данных (два примера приведены здесь):

InputSource inputSource = new InputSource(is);
//inputSource.setEncoding("iso-8859-1");
inputSource.setEncoding("utf-8");
...