Скачивание ответа с WebResponse - изображения включены? - PullRequest
0 голосов
/ 17 марта 2011

Я пытаюсь загрузить HTML, чтобы проанализировать его, используя минимальную пропускную способность для загрузки. Это немного моего кода.

if (!String.IsNullOrEmpty(siteAddress))
                webReq = WebRequest.Create(siteAddress)

                WebResponse webRes = webReq.GetResponse();

                Stream streamResponse = webRes.GetResponseStream();
                StreamReader streamRead = new StreamReader(streamResponse);
                StringReader sr = new StringReader(streamRead.ReadToEnd().Trim());

                streamResponse.Close();
                streamRead.Close();    
                webRes.Close();

                HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument();
                hDoc.Load(sr);

Может ли кто-нибудь подтвердить, что при получении ответа предоставляется только текстовый ответ, и изображения также не загружаются? А как насчет загрузки его методом HTMLAgilityPack?

Ответы [ 2 ]

2 голосов
/ 17 марта 2011

При использовании WebClient, WebRequest или HtmlAgilityPack загружается только html .

Если вам нужны изображения (или другие ресурсы), вам необходимо выполнить поиск URL-адресов изображений в загруженном документе и самостоятельно запросить их получение.

Если вы хотите немного поэкспериментировать, можно посмотреть на элемент управления WebBrowser. После этого вы можете взять свойство Document, посмотреть его свойство Images и загрузить все изображения самостоятельно.

Что вы хотите сделать?

1 голос
/ 17 марта 2011

Вы скачиваете исходный HTML-код сайта, а не весь сайт.Это большая разница.

См. Как использовать HTML Agility Pack , а также этот

...