Разобрать это html регулярное выражение таблицы - PullRequest
0 голосов
/ 18 марта 2020

У меня есть два связанных вопроса:

У меня есть следующий html текст:

<td style="work" class="sort"> 1500 </td>

Я хотел бы проанализировать 1500, желательно без пробелов вокруг него, хотя я всегда мог обрезать после.

Я тестирую на regex101, и вот что у меня есть:

>.*?<\/td>

Он возвращает мне обратно:

> 1500 </td>, что близко к тому, что я хочу. Я имею в виду, что я могу просто вручную разобрать это после, но я бы предпочел получить только 1500 назад.


Второй вопрос:

Если у меня есть следующий текст html:

<td style="work"> <a class="link" href="/img"> Lake </a> </td>

Как я могу разобрать это, чтобы получить обратно Lake? Если я использую регулярное выражение >.*?<\/a>, я получу обратно

> <a class="link" href="/img"> Lake </a>, что больше, чем я хочу.

1 Ответ

0 голосов
/ 18 марта 2020

Используйте Скобки для группировки и захвата

Первая проверка для шаблона >(.*?)<\/a>. Если это не совпадает, проверьте >(.*?)<\/td>

Однако не рекомендуется анализировать HTML с помощью регулярных выражений. Прочитайте об этом здесь .

Редактировать: Решение MDR (^.*?> (\w+) <.*?$) работает, если вы хотите только захватить словосочетателей .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...