XmlStreamReader не читает полное текстовое значение - PullRequest
0 голосов
/ 06 октября 2010

Похоже, этот вопрос возник раньше, как я вижу в Чтение escape-символов с XMLStreamReader

Но проблема, с которой я здесь сталкиваюсь, немного отличается.

Я читаю довольно большой XML-файл, который содержит большой фрагмент искаженного html в качестве одного из значений тега. Значения заключены в CDATA и обычно они не вызывают каких-либо проблем. Но периодически метод getText класса XMLSTreamReader считывает только половину текста в этом CDATA, и первый символ в следующем пакете выглядит как пример: «

1 Ответ

1 голос
/ 07 октября 2010

Я думаю, что решил немного с этой проблемой. Проблема, кажется, в реализации sjsxp (даже там последняя). Иногда метод getText не читает весь текст, и если вам так же не повезло, как мне, вы встретите тег, и это вызовет проблему. Мы планировали закодировать значения, которые могли бы работать, но мы также попробовали реализацию woodstox (http://woodstox.codehaus.org), и это, кажется, справляется с этим случаем. Поэтому нам хотелось задать следующий вопрос:

Кто-нибудь еще использовал реализацию Woodstox для Stax и знает, есть ли какие-либо проблемы по сравнению с sjsxp?

...