У меня есть документ с множеством таких строк:
<tr><td width="10%">doc_no_320F0321</td><td width="5%">116</td><td> bla bla bla 1976, bla bla point (2) bla bla bla. </td><td> bla bla bla 1976, bla bla point (1) bla bla bla. </td></tr>
(Украсить это будет так:
<tr>
<td width="10%">doc_no_320F0321</td>
<td width="5%">116</td>
<td> bla bla bla 1976, bla bla point (2) bla bla bla. </td>
<td> bla bla bla 1976, bla bla point (1) bla bla bla. </td>
</tr>
)
Что мне нужно do это проверить, совпадают ли цифры из третьего и четвертого , игнорируя другие символы.
Для этого я пытаюсь выделить их с помощью , поэтому что их легче увидеть. Я запускаю эту замену sed:
sed -i -r 's|(<td>.*?)([[:digit:]]+)(.*?<\/td>)|\1<mark>\2<\/mark>\3|g'
Но он окружает только последний di git в каждой строке .
Может ли кто-нибудь помочь мне окружить ВСЕ комбинации цифр в 3-м и 4-м тегах?
Спасибо.