номер
Смысл синтаксического анализа состоит в том, чтобы преобразовать исходный код HTML в модель документа (чтобы вы могли манипулировать им программно).
<p
превращается в текстовый узел, содержащий <p
, а теги <html>
и <body>
генерируют элементы HTML и BODY .
Затем выполняется любая манипуляция с моделью.
Затем в какой-то момент вы превращаете модель обратно в HTML. Это не (и не может, по крайней мере, не разумно) принимать во внимание исходный исходный код. Он экранирует специальные символы (например, <
) в текстовых узлах и генерирует конечные теги для элементов, которые могут иметь конечные теги. Результатом является нормализованный документ.