Ошибка запроса веб-страницы, проанализированной с помощью HTML Agility Pack - PullRequest
1 голос
/ 02 сентября 2011

У меня есть следующий фрагмент исходного кода:

<div class = "discount_tools_row">
  <div class = "discount_tools">
    <ul> 
      <li><a href = "#" class = "share-discount" rel = "nofollow"></a></li>
      <li><a href = "/deal/map/4243683"
             class = "show-location"
             title = "הראה מקום על מפה"
             data-address = "רח&#39; האצ&quot;ל 39, ראשון לציון"></a></li>
    </ul>

    <link rel = "prerender"
          href = "http:/ / www.bigdeal.co.il / ? CampaignId = 873 & sId = 10 ">
    <a class = "tavo_button"
       data-provider = "bigdeal"
       href = "http : //www.bigdeal.co.il/?CampaignId=873&sId=10"
       target="_blank"
       rel = "nofollow">תבוא!</a>
    </div>
  </div>
</div>

Используя HTML Agility Pack, я хочу получить пары <data-address value, link rel="prerender" href value>.

Я попробовал следующее, но получил неправильные результаты:

var nodes = doc.DocumentNode.SelectNodes(
    "//div[@class=\"discount_tools\"]");
var geoNodes = nodes.Where(node => !string.IsNullOrEmpty(
    node.ChildAttributes("data-address").ToString()));
AnswerFormat ans = new AnswerFormat {
    Locations = geoNodes.Select(
        node => node.ChildAttributes("data-address").ToString()).ToList(),
    //Names = nodes.Select(node => node.Attributes["data-address"].Value).
    //ToList(),
    Details = geoNodes.Select(
        node => node.ChildAttributes("data-direct-url").ToString()).ToList()
};

Я пытался достичь всего

< div class = "discount_tools" >

с

data-address

атрибут в их childNode и

  <a class="tavo_button" data-provider="bigdeal" href=

в другом дочернем узле

Как я могу улучшить свой запрос?

Ответы [ 2 ]

0 голосов
/ 07 мая 2012
String dataAddressValue = doc.DocumentNode.SelectSingleNode("//div[@class='discount_tools']/ul/li/a[@class='show-location']").Attributes["data-address"].Value;

String LinkHrefValue = doc.DocumentNode.SelectSingleNode("//div[@class='discount_tools ']/link[@rel=’prerender’]").Attributes["href"].Value;
0 голосов
/ 02 сентября 2011

Это было мое решение:

        var nodes = doc.DocumentNode.SelectNodes("//div[@class=\"discount_tools\"]");
        var linksCollections = nodes.Select(node => node.Descendants("a"));

        List<string> Locations = new List<string>();
        List<string> Categories = new List<string>();
        List<string> Hrefs = new List<string>();

        foreach (var col in linksCollections)
        {
            string location, category, href;
            location = GetAtt("data-address",col);
            if (!string.IsNullOrEmpty(location))
            {
                category = GetAtt("data-kind", col);
                if (!string.IsNullOrEmpty(category))
                {
                    href = GetAtt("data-provider", "href", col);
                    if (!string.IsNullOrEmpty(href))
                    {
                        Locations.Add(location);
                        Categories.Add(category);
                        Hrefs.Add(href);
                    }
                }
            }

        }
...