У меня есть 3 строки HTML-кода здесь:
Я хочу извлечь выделенные области, каждый из цветов в группе.
<TD STYLE="border-bottom>2,000,000</TD><TD STYLE="padding-bottom: 4pt; text-align: left"> </TD><TD STYLE="padding-bottom: 4pt"> </TD>
<TD STYLE="text-align: left"> </TD><TD STYLE="text-align: right">1,333,000</TD><TD STYLE="text-align: left"> </TD><TD> </TD>
<TD COLSPAN="2"> </TD><TD> </TD></TR>
Я пытался:
(?<=</TD>)<TD.*>( <)/TD>
соответствует только задней части, но не соответствует первой.
Это то, что я ожидал:

Я получаю эти выделенные значения в списке:
1-й строки:
<TD STYLE="padding-bottom: 4pt; text-align: left"> </TD>
<TD STYLE="padding-bottom: 4pt"> </TD>
из 2-й строки:
<TD STYLE="text-align: left"> </TD>
<TD STYLE="text-align: left"> </TD>
<TD> </TD>
3-й строки:
<TD COLSPAN="2"> </TD>
<TD> </TD>
В конце концов:
['<TD STYLE="padding-bottom: 4pt; text-align: left"> </TD>','<TD STYLE="padding-bottom: 4pt"> </TD>','<TD STYLE="text-align: left"> </TD>','<TD STYLE="text-align: left"> </TD>','<TD> </TD>','<TD COLSPAN="2"> </TD>','<TD> </TD>']