Очистка таблиц HTML в .NET и забота о colspans - PullRequest
0 голосов
/ 04 ноября 2010

Я пытаюсь очистить таблицы HTML в своем приложении .NET, однако я наткнулся на таблицы, которые активно используют атрибуты colspan и rowspan в ячейках, что вызывает у меня головную боль. Мне было интересно, есть ли доступная библиотека, которая может преобразовать таблицу в массив строк и позаботиться о colspan, например, если colspan = 5 для элемента TD, тогда он будет использовать значение TD для следующих 5 элементов

<table>
<tr>
 <td>1</td>
 <td>2</td>
 <td>3</td>
 <td>4</td>
 <td>5</td>
</tr>
<tr>
  <td colspan=4>1</td>
  <td>2</td>
</tr></table>

на выходе будет массив из следующего:

[1,2,3,4,5] [1,1,1,1,2]

Ответы [ 2 ]

1 голос
/ 04 ноября 2010

вы можете использовать ParseControl, что сделает все это довольно тривиальным, поскольку вы можете получить доступ к свойству Colspan.

0 голосов
/ 04 ноября 2010

Вы можете поместить его в XmlDocument, а затем выполнить цикл. Не уверен, что это лучшее решение, но оно работает. Может быть, LINQ to XML?

...