Как разобрать текст в тегах <li>без идентификатора, ClassName ...? - PullRequest
0 голосов
/ 07 января 2019

Я делаю школьный проект в VB.Net для фильтрации информации из веб-страниц, загруженных элементом управления WebBrowser. Я застрял в какой-то момент, когда HTML-код не имеет идентификаторов, таких как ID, ClassTags и так далее ... Какое лучшее решение для получения информации с веб-страницы?

Я уже пытался получить его поверх высшего класса <ul class="TopInfo">, чтобы получить внутренний текст, но он просто распечатывает все между <ul></ul> тегами.

<ul class="TopInfo"> <li><strong>Bargeld:</strong> 1,106,378 €</li> <li><strong>Bank:</strong> 0 €</li> </ul>

Мне нужно получить эти значения:

Bargeld: 1,106,378 € и Bank: 0 €

1 Ответ

0 голосов
/ 07 января 2019

Хорошо, я заставил его работать, к счастью.

Для будущих интересов вот код, который я использовал:

           For each h As HtmlElement In Form1.WebBrowser1.Document.GetElementsByTagName("ul")
            if Not Object.ReferenceEquals(h.GetAttribute("className"), Nothing) AndAlso h.GetAttribute("className").Equals("TopInfo") Then
                MsgBox(h.InnerText)
                Exit For
            End If
        Next
...