Html Agility Pack - цикл по строкам и столбцам - PullRequest
1 голос
/ 30 июля 2010

Как я могу перебрать таблицу и строку, имеющие идентификатор или имя атрибута, чтобы получить внутренний текст в глубине каждой ячейки td? Я работаю над asp.net, c # и новейшим html-пакетом. Пожалуйста, руководство. Спасибо.

HTML-файл имеет несколько таблиц. Один из них имеет атрибут id = main-part. В этой идентифицированной таблице есть много строк. Некоторые из этих строк имеют одинаковый атрибут name = display. В этих именованных строках есть много столбцов, из которых я должен извлечь текст. Примерно так:

<body>
<table>
...
</table>
<table>
...
</table>

<table id="main-part">
   <tr>
     <td></td>
     ...
   </tr>
   <tr>
     <td></td>
     ...
   </tr>
   <tr name="display">
     <td>Jan</td>
     <td>Feb</td>
     <td>Mar</td>
     ...
   </tr>
      <tr name="display">
     <td>Apr</td>
     <td>May</td>
     <td>June</td>
     ...
   </tr>
      <tr name="display">
     <td>Jul</td>
     <td>Aug</td>
     <td>Sep</td>
     ...
   </tr>
   <tr>
     <td></td>
     ...
   </tr>
   <tr name="display">
     <td>Oct</td>
     <td>Nov</td>
     <td>Dec</td>
     ...
   </tr>
   <tr>
     <td></td>
     ...
   </tr>
</table>
<table>
...
</table>
</body>

Ответы [ 2 ]

2 голосов
/ 30 июля 2010

Вам нужно выбрать эти узлы, используя xpath:

foreach(HtmlNode cell in doc.DocumentElement.SelectNodes("//tr[@name='display']/td")
{
   // get cell data
}
1 голос
/ 30 июля 2010

Это сработало! Большое спасибо Одед.

    HtmlDocument doc = new HtmlDocument();
         doc.Load(@"C:/samplefolder/sample.htm"); 
foreach(HtmlNode cell in doc.DocumentNode.SelectNodes("//tr[@name='display']/td")) 
{
         string test = cell.InnerText;
         Response.Write(test); 
}

Он показал результат как JanFebMarAprMayJuneJulAugSepOctNovDec . Как их отсортировать, разделив пробелом или табуляцией? Спасибо.

...