Проверка XML для больших файлов проходит даже с ошибками - PullRequest
0 голосов
/ 10 апреля 2019

Я борюсь с моим большим XML-файлом (28000 строк).Этот xml иногда имеет повторяющийся закрывающий тег

eg: <question>what can i do?</question>>

Весь онлайн-валидатор xml не находит ошибку с такими большими файлами и дает мне пароль на код.

Я пыталсявалидатор w3c xml, и он также не работает (ссылка) .

Мой xml автоматически генерируется по-настоящему устаревшим кодом, и никто не собирается решать проблему, поэтому я искалкакой-нибудь валидатор онлайн или программное обеспечение, чтобы сделать это для меня, не заходя в блокнот в поисках тега.

Кто-нибудь знает, как мне решить эту проблему?Я что-то пропустил?любой совет?

Спасибо

1 Ответ

1 голос
/ 10 апреля 2019

Дополнительный '>' на самом деле является действительным xml и обрабатывается как символьные данные (см. https://www.w3.org/TR/xml/#syntax),, поэтому он проходит проверку.

Если вы знаете точную структуру xml, вы можете попробоватьопределить XML-схему для нее и проверить ее, например:

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="unqualified">
  <xs:element name="root">
    <xs:complexType>
      <xs:sequence>
        <xs:element name="question" type="xs:string" minOccurs="0" maxOccurs="unbounded"/>
      </xs:sequence>
    </xs:complexType>
  </xs:element>
</xs:schema>

Инициирует ошибку проверки для:

<root>
    <question>what can i do?</question>>
</root>
...