regex: отфильтровать группу, начинающуюся с определенной строки - PullRequest
0 голосов
/ 26 мая 2020

Текст, который я хотел бы проанализировать, выглядит следующим образом:

<p class="p p1"><strong>Analysts</strong></p>\n<p class="p p1">Mark Troman - BofA Merrill Lynch, Research Division</p>\n<p class="p p1">Ben Uglow - Morgan Stanley, Research Division</p>

Используя reg = <p class="p p[1-9][0-9]{0,1}">(.+?)<\/p>, я могу получить две группы:

  • <strong>Analysts</strong>
  • Ben Uglow - Morgan Stanley, Research Division

Однако я хочу отфильтровать группы, которые начинаются с <strong> и заканчиваются </strong>, и просто оставлять Ben Uglow - Morgan Stanley, Research Division.

Есть ли любой способ переписать выражение регулярного выражения и выполнить sh фильтрацию в однострочном регулярном выражении?

1 Ответ

1 голос
/ 26 мая 2020

Я хочу отфильтровать группы, которые начинаются с

Это регулярное выражение должно соответствовать только группам, которые не содержат <strong>:

<p class="p p[1-9][0-9]{0,1}">([a-zA-Z0-9, -]+?)<\/p>

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...