Большинство анализаторов XML сдаются после первой ошибки в документе. Фактически, IIRC, это фактически часть «официальной» спецификации для парсеров.
Я ищу что-то, что нарушит это правило. Он должен принимать заданную схему (при условии действительной схемы) и ввод XML и пытаться продолжать идти после первой ошибки и либо вызывать событие для каждой ошибки, либо возвращать список по окончании, чтобы я мог использовать его для генерации некоторого вида отчет об ошибках в документе. Это требование вытекает из вышесказанного, поэтому давайте постараемся сохранить пуристический ", но не имеет смысла продолжать" комментарии до минимума
Я ищу что-то, что оценило бы, правильно ли сформирован документ и , соответствует ли оно схеме. В идеале это оценило бы их как различные классы ошибок. Я бы предпочел решение .Net, но я мог бы также использовать автономный .exe. Если вам известна платформа, использующая другую платформу, опубликуйте ее, потому что кто-то другой может найти ее полезной.
Обновление:
Я ожидаю, что большинство документов, в которых я это использую, будут в основном правильно сформированными. Может быть & в виде данных вместо & amp здесь и там, или случайный неверно размещенный тег. Я не ожидаю, что парсер сможет оправиться от чего-либо, просто приложит максимум усилий для продолжения работы. Если документ слишком поврежден, он должен выплевывать столько, сколько может, после чего следует какая-то «фатальная, неспособная продолжить» ошибка. Иначе часть проверки схемы довольно проста.