VB.NET ~ как перейти на веб-сайт и скачать HTML, а затем проанализировать код, чтобы отобразить только элементы ввода? - PullRequest
0 голосов
/ 13 декабря 2011

Я пробовал несколько вещей, таких как преобразование HTML в XML и затем использование навигатора XML для получения элементов ввода, но я теряюсь всякий раз, когда начинаю этот процесс.

Я пытаюсь перейти на веб-сайт, который будет загружен с использованием textbox1.text

Затем скачайте html и разберите входные элементы, например. имя пользователя, пароль и т. д. и поместите элемент по типу (идентификатор или имя) в поле richtextbox с атрибутом рядом с именем.

Пример.

Username id="username"
Password id="password"

Какие-либо подсказки или как правильно выполнить преобразователь HTML в XML, читатель, анализатор?

Спасибо

Ответы [ 2 ]

0 голосов
/ 14 декабря 2011

Что-то вроде ниже использует потоковый читатель для извлечения источника страницы в строку result

  Dim uri As String = "https://www.yourUrl.com"          

    Dim request As HttpWebRequest = CType(WebRequest.Create(uri), HttpWebRequest)
    Dim objRequest As HttpWebRequest = WebRequest.Create(uri)
    Dim result As String
    objRequest.Method = "GET"
    Dim objResponse As HttpWebResponse = objRequest.GetResponse()
    Dim sr As StreamReader
    sr = New StreamReader(objResponse.GetResponseStream())

    result = sr.ReadToEnd()
    sr.Close

Затем используйте регулярное выражение (регулярное выражение) для добавления необходимых атрибутов. например что-то вроде этого

Dim pattern As String = "(?<=Username id="")\w+"

    Dim m0 As MatchCollection = Regex.Matches(result, pattern, RegexOptions.Singleline)
    Dim m As Match
    Dim k As Integer = 0
    dim strUserID as String = ""

    For Each m In m0

    'extract the values for username id
    strUserID = m0[k].Value;

    k=k+1
    Next

Вам нужно изменить pattern, чтобы он мог подобрать другие атрибуты, которые вы хотите найти, но это не должно быть сложно

0 голосов
/ 13 декабря 2011

Похоже, вам просто нужна хорошая библиотека для разбора HTML (вместо того, чтобы пытаться использовать анализатор XML). HTML Agility Pack часто соответствует этой потребности. Также есть другие опции .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...