В настоящее время я пытаюсь написать регулярное выражение для удаления ссылок со страницы, которая у меня есть. Проблема заключается в том, что ссылки нужно извлекать только в том случае, если ссылки имеют «запас», например. Вот набросок того, что у меня есть код мудрый:
<td class="prd-details">
<a href="somepage">
...
<span class="collect unavailable">
...
</td>
<td class="prd-details">
<a href="somepage">
...
<span class="collect available">
...
</td>
То, что я хотел бы сделать, это вытащить ссылки, только если в теге есть «собирать доступные». Я пытался сделать это с помощью регулярного выражения:
(?s)prd-details[^=]+="([^"]+)" .+?collect{1}[^\s]+ available
Однако, запустив его, он найдет первый класс 'prd-details' и продолжит работу, пока не найдет 'collection available', что приведет к неверным результатам. Я подумал, указав {1} после слова собирать, он будет использовать только первый экземпляр найденного слова, но, очевидно, я ошибаюсь. Я пытался использовать разные вещи, такие как позитивные и негативные взгляды, но я не могу заставить что-либо работать.
Может ли кто-нибудь помочь мне с этим вопросом?
Спасибо
Dan