VB.NET ~ У меня исправлено приложение, чтобы дать мне все теги img src для веб-сайта.Но один нужный мне тег не указан в результатах - PullRequest
0 голосов
/ 08 января 2012

Источник img, который мне нужно взять:

div id="recaptcha_image" class="width: 300px; height: 57px;" style="width: 300px; height: 57px;">
<img width="300" height="57" src="http://www.google.com/recaptcha/api/image?c=03AHJ_VuvlvMA4JvVIQvDR4C_iDbOTwOF5FUIRPGkkSImDRYAD6sY2L0IxyJSpSP1WGjWqr0MQ-dmjkiIgevFY2gkMpNWi1cQbtgUZB5QaYr_vIHv6xFzG9ydFbBWs4xiEhWoxHEFUYHZj6CCh4obyZSOd2La0nozLZw" style="display:block;">

Вот мой код, который захватывает все теги img src с любого веб-сайта. Единственное, что мне нужно - это img src, которого нет в возвращаемых результатах.

Как я могу исправить свой код, чтобы захватить только это одно поле? Вот моя рабочая программа ... в настоящее время она не загружает картинку в картинку ... но она возвращает результаты в поле расширенного текста. Спасибо

Dim s As String = TextBox1.Text

Dim hw As New HtmlWeb()
Dim doc As HtmlDocument = hw.Load(s)

Dim items As HtmlNodeCollection = doc.DocumentNode.SelectNodes("//img")
If items Is Nothing Then
    MessageBox.Show("There is nothing to show you")
End If
If items IsNot Nothing Then
    For Each item As HtmlNode In items
        RichTextBox2.Text = RichTextBox2.Text & (item.GetAttributeValue("src", "value") & Environment.NewLine)
        'PictureBox1.Load(item.GetAttributeValue("src", TextBox1.Text & "value"))

    Next

1 Ответ

0 голосов
/ 08 января 2012

Без полного HTML трудно сказать, но если вы хотите src для этого конкретного img, вы можете использовать следующее в SelectNodes (которое, вероятно, следует изменить на SelectSingleNode).

doc.DocumentNode.SelectSingleNode("//div[@id='recaptcha_image']/img[1]").Attributes("src").Value

Выше будет возвращена строка src для тега img.

...