Определенный веб-сайт, возвращающий ноль с пакетом HTML Agility - PullRequest
0 голосов
/ 11 ноября 2018

Итак, я пытаюсь очистить веб-сайт и использую HTML Agility Pack, чтобы попытаться это сделать. Я попробовал свой код на сайтах html-agility-pack и google, и, похоже, он отлично работает с этим простым поиском.

Моя проблема в том, что код возвращает ошибку («System.NullReferenceException:« Ссылка на объект не установлена ​​на экземпляр объекта. »») В этой строке кода:

Console.WriteLine("Node Name: " + node.Name + "\n" + node.OuterHtml);

Я понимаю, что это происходит потому, что узел var возвращает Null, но почему это происходит на этом веб-сайте, а не на других?

        //var html = @"http://html-agility-pack.net/";
        var html = @"https://www./";
        //var html = @"https://www.google.com/";

        HtmlWeb web = new HtmlWeb();
        HtmlDocument htmlDoc = web.Load(html);

        if (web.StatusCode == HttpStatusCode.OK)
        {
            Console.WriteLine("CONNECTION OK");
            var node = htmlDoc.DocumentNode.SelectSingleNode("//head/title");

            Console.WriteLine("Node Name: " + node.Name + "\n" + node.OuterHtml);
            Console.ReadLine();
        }else
        {
            Console.WriteLine("No Connection to website");
            Console.ReadLine();
        }
...