Это адаптировано из кода в CodeGuru. Большое Большое спасибо оригинальному автору:
http://www.codeguru.com/vb/vb_internet/html/article.php/c4815
Проверьте исходный код, если вам нужно загрузить HTML из Интернета. E.g.:
Set objDocument = objMSHTML.createDocumentFromUrl("http://google.com", vbNullString)
Мне не нужно загружать заглушку HTML из Интернета - у меня уже была заглушка в памяти. Таким образом, первоисточник не совсем подходит для меня. Моя главная цель - сделать так, чтобы квалифицированный парсер DOM убрал для меня HTML из контента, созданного пользователем. Кто-то скажет: «Почему бы просто не использовать RegEx для удаления HTML-кода?» Удачи с этим!
Добавить ссылку на: Microsoft HTML Object Library
Это тот же HTML-парсер, который запускает Internet Explorer (IE) - пусть начинается хеклинг. Ну, черт возьми ...
Вот код, который я использовал:
Dim objDocument As MSHTML.HTMLDocument
Set objDocument = New MSHTML.HTMLDocument
'NOTE: txtSource is an instance of a simple TextBox object
objDocument.body.innerHTML = "<p>Hello World!</p> <p>Hello Jason!</p> <br/>Hello Bob!"
txtSource.Text = objDocument.body.innerText
Полученный текст в txtSource.Text является Содержанием моего Пользователя без всего HTML. Чистота и ремонтопригодность - мне нет пути Ктулху.