Я пытаюсь очистить таблицы HTML в своем приложении .NET, однако я наткнулся на таблицы, которые активно используют атрибуты colspan и rowspan в ячейках, что вызывает у меня головную боль. Мне было интересно, есть ли доступная библиотека, которая может преобразовать таблицу в массив строк и позаботиться о colspan, например, если colspan = 5 для элемента TD, тогда он будет использовать значение TD для следующих 5 элементов
<table>
<tr>
<td>1</td>
<td>2</td>
<td>3</td>
<td>4</td>
<td>5</td>
</tr>
<tr>
<td colspan=4>1</td>
<td>2</td>
</tr></table>
на выходе будет массив из следующего:
[1,2,3,4,5]
[1,1,1,1,2]