asp.net C # получить окончательный источник страницы веб-страницы - PullRequest
0 голосов
/ 21 февраля 2012

Я пытаюсь получить окончательный источник веб-страницы.Я использую метод openRead webclient, но этот метод возвращает только исходный источник страницы.После загрузки исходного кода запускается javascript, который собирает нужные мне данные в другом формате, и мой метод будет искать что-то, что было полностью изменено.То, о чем я говорю, точно так же, как разница между:

  1. , щелкнув правой кнопкой мыши на веб-странице -> выберите источник просмотра
  2. доступ к инструментам разработчика

Посмотрите на этот сайт, чтобы узнать, о чем я говорю: http://www.augsburg.edu/history/fac_listing.html и посмотреть, как отображается любое электронное письмо с использованием каждого параметра.Я думаю, что происходит то, что первый покажет вам начальную загрузку страницы.Вторая покажет вам последнюю страницу HTML.Веб-клиент только позволяет мне сделать вариант № 1.

вот код, который будет возвращать только опцию # 1.О, мне нужно сделать это из консольного приложения.Спасибо!

private static string GetReader(string site)
{
    WebClient client = new WebClient();
    try
    {
        data = client.OpenRead(site);
        reader = new StreamReader(data);
    }
    catch
    {
        return "";
    }
    return reader.ReadToEnd();
}

1 Ответ

0 голосов
/ 23 февраля 2012

Я нашел решение своей проблемы. В итоге я использовал свойство PageSource для Selenium-WebDriver. Работало прекрасно!

Узнайте о Selenium и Webdriver. Это легко научиться. Помогает для тестирования и на этом!

...