Парсер в JDK был форком Xerces, но он очень глючный.Я бы порекомендовал производственным приложениям всегда использовать версию анализатора Apache.Ошибки редки, но они непредсказуемы, и они влияют не только на угловые случаи, которые не видны в реальной жизни;Я видел много случаев, когда довольно скучные XML-документы анализируются, и поврежденные данные передаются в приложение для значений атрибутов.Sun / Oracle не проявили интереса к решению проблемы.Используйте Apache Xerces каждый раз.
ОБНОВЛЕНИЕ (2018)
Проблемы с версией Jerk Xerces, по-моему, решены в Java 8, насколько я вижу, поэтому этот советустарел.