любой XML содержит свойство кодирования в заголовке. И это UTF-8 по умолчанию. Если ваш XML содержит байты, которые невозможно распознать с помощью SAX-парсера, значит, у вас нет «правильно сформированного» XML. Другой способ - указать правильную кодировку / кодировку для InputStreamReader, который вы используете.