Как преобразовать все экранированные символы html в приведенную в порядок строку xhtml, чтобы она загружалась в XmlDocument? - PullRequest
0 голосов
/ 28 октября 2008

В веб-приложении .net я общаюсь со сторонним API CMS, который возвращает html. Мне нужно преобразовать его в правильно сформированный xml, поэтому я использую .NET-оболочку для аккуратного HTML. Это создает хороший DOM, но все идет не так, когда используются такие символы, как  .

Мне нужно, чтобы они были преобразованы в формат кода, например  , чтобы XmlDocument мог его принять.

Не могу установить больше параметров для аккуратной обертки, кроме как сделать ее XHTML. Так что с возвращенной строкой мне нужно немного поработать, но я думаю, что все сводится к регулярным выражениям, использующим мое собственное отображение?

1 Ответ

1 голос
/ 28 октября 2008

Если ваша оболочка .NET позволяет привести в порядок все возможные параметры в командной строке и в ее конфигурационном файле, вы должны получить то, что вам нужно, установив для 'numeric-entity' и 'output-xml' оба значения 'true' .

...