Есть ли способ сказать компоненту C # WebBrowser не изменять исходный HTML? - PullRequest
4 голосов
/ 23 марта 2012

Я заметил, что Internet Explorer, который используется компонентом веб-браузера, изменяет исходный исходный код. Я понимаю, что часть кода должна измениться из-за запросов ajax и всего остального. Когда я заявлял, что html изменен, я ссылаюсь на те теги, которые вставляются, даже если их нет в реальном исходном коде. Например, IE завершает тег «body», когда его нет, а также тег «tbody», когда в таблице его нет. Есть ли способ сохранить исходную структуру документа?

Если вы не поняли вопрос, дайте мне знать, спасибо.

1 Ответ

1 голос
/ 23 марта 2012

Я должен был сделать некоторые предположения, но вот моя теория:

То, что вы видите, это не IE, изменяющий HTML.Я не знаю, как вы это увидели, но это IE сериализует дерево DOM.Конечно, IE должен закрыть тег body (или создать элемент DOM body, если мы должны быть точными), чтобы что-то отобразить.Сериализованный DOM - это не то, чем был исходный HTML, и если вы хотите извлечь исходный HTML, вы, вероятно, не используете правильный инструмент.Такое поведение иногда проявляется в редакторах WSIYWYG и при использовании сохранения страницы в IE.Он просто сбрасывает свое внутреннее дерево DOM обратно в строку, и в дереве DOM нет неполных элементов, поскольку они являются узлами дерева, а не тегами.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...