Как получить контент из HTML с помощью VB6 - PullRequest
1 голос
/ 05 марта 2009

Как я могу получить контент из HTML, удалив элементы вокруг него.

Я ищу пример с использованием VB6

Ответы [ 3 ]

5 голосов
/ 05 марта 2009

Вы можете использовать Internet Explorer в качестве COM-объекта (не показывая его на экране). Например, чтобы получить текстовую версию HTML:

Public Function Html2Text(ByVal Data _
   As String) As String
      Dim obj As Object
      On Error Resume Next
      Set obj = _
         CreateObject("htmlfile")
      obj.Open
      obj.Write Data
      Html2Text = obj.Body.InnerText
End Function

Вы также можете пройтись по дереву элементов, чтобы сделать что-то более сложное.

Кредит: Карл Петерсон в Visual Studio Magazine .

2 голосов
/ 05 марта 2009

Вы можете использовать регулярные выражения; Создайте свой шаблон и извлеките нужные данные из HTML. По этой ссылке вы можете узнать, как вы можете использовать регулярные выражения в vb6 http://www.regular -expressions.info / vb.html

0 голосов
/ 05 марта 2009

HTML может быть некорректно сформирован, что затрудняет удаление тегов с регулярными выражениями. Альтернативой является загрузка Internet Explorer как COM-объекта в VB, а затем загрузка HTML-документа в Internet Explorer и использование его для просмотра дерева интерпретируемых элементов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...