Я создаю сайт, который должен собрать информацию с сайта партнера. Теперь мой очищающий код отлично работает с другими сайтами, но не с этим. Это обычный .html сайт. Я думаю, что это может быть сгенерировано как с php (сайт построен с php).
Я понятия не имею, я просто догадываюсь о сгенерированной части, и мне нужна ваша помощь профессионалов в этом. Если это имеет значение, вот мой код, который я использую. HtmlDocument - это htmlAgilityPack, но это не имеет к этому никакого отношения. Результат нулевой на сайте, который я пытаюсь.
string result;
var objRequest = System.Net.HttpWebRequest.Create(strUrl);
var objResponse = objRequest.GetResponse();
using (var sr = new StreamReader(objResponse.GetResponseStream()))
{
result = sr.ReadToEnd();
sr.Close();
var doc = new HtmlDocument();
doc.LoadHtml(result);
foreach (var c in doc.DocumentNode.SelectNodes("//a[@href]"))
{
litStatus.Text += c.Attributes["href"].Value + "<br />";
}
}
EDIT:
это из валидатора w3, может быть что-то с этим?
Извините, я не могу проверить этот документ, потому что в строке 422 он содержал один или
больше байтов, которые я не могу интерпретировать как utf-8 (другими словами, найденные байты недопустимы
значения в указанной кодировке символов). Пожалуйста, проверьте содержимое файла и
индикация кодировки символов.
Ошибка: utf8 "\ xA9" не сопоставляется с Unicode