Текст, который я хотел бы проанализировать, выглядит следующим образом:
<p class="p p1"><strong>Analysts</strong></p>\n<p class="p p1">Mark Troman - BofA Merrill Lynch, Research Division</p>\n<p class="p p1">Ben Uglow - Morgan Stanley, Research Division</p>
Используя reg = <p class="p p[1-9][0-9]{0,1}">(.+?)<\/p>
, я могу получить две группы:
<strong>Analysts</strong>
Ben Uglow - Morgan Stanley, Research Division
Однако я хочу отфильтровать группы, которые начинаются с <strong>
и заканчиваются </strong>
, и просто оставлять Ben Uglow - Morgan Stanley, Research Division
.
Есть ли любой способ переписать выражение регулярного выражения и выполнить sh фильтрацию в однострочном регулярном выражении?