Я пытаюсь разобрать html, чтобы отключить значения различных атрибутов элемента.Я решил, что самый надежный способ анализа html - это использование синтаксического анализатора xml (msxml.)
. Проблема в том, что html, который я пытаюсь проанализировать, содержит атрибут, такой как:
<param name="flashvars" value="autoplay=false&brand=embed&cid=97%2Ftest&locale=en_US"/>
Что приводит к взрыву парсера xml.Я понял, что мне нужно server.htmlencode()
атрибут value
для корректной загрузки анализатора xml.Как мне подойти к этому?
Мне кажется, что проблема в замкнутом круге.Я не мог использовать регулярные выражения, потому что html недостаточно регулярен, и теперь я не могу использовать парсеры xml, потому что html не «правильно сформирован»
help.Как мне подойти к этому вопросу?Я хочу иметь возможность изменять значения атрибутов с помощью VBScript.