исправление искаженного XML - PullRequest
2 голосов
/ 22 июля 2011

У меня есть огромный файл, который состоит из искаженного xml (в основном это неэкранированные символы XML и разделы CDATA).Я ищу достойный парсер, который может исправить искаженный XML.Я использовал IntelliJIdea для работы с некоторыми небольшими XML-файлами, но IDE зависает, когда я передаю ему огромный файл.

Есть ли достойные инструменты, которые могут исправить искаженный XML?

1 Ответ

0 голосов
/ 22 июля 2011

Я уверен, что кто-то скажет вам вернуться и починить генератор файла.Если это возможно, это, безусловно, было бы лучше всего сделать.

Похоже, вы планируете делать это более или менее вручную - ищите образцы дефектов и исправляйте их.Для этого я бы использовал Notepad ++ - просто потому, что я его знаю, он будет обрабатывать действительно большие файлы и имеет хорошие функции поиска / замены, включая регулярные выражения.Однако есть много возможностей для совершенствования - в частности, язык регулярных выражений немного слаб, если вы являетесь регулярным выражением.

Все, что пытается понять, что XML делает больше, чем хроматическое кодирование, вероятно, будет медленным при работе с таким файлом.

Поддержка XML в Intellij потрясающе плоха с точки зрения производительности, учитывая ее общее превосходство.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...