python regex - найти теги html с указанием класса c - PullRequest
0 голосов
/ 06 мая 2020

Я хочу написать регулярное выражение, которое извлекает текст из всех html элементов класса, важных из этой строки:

text = """Lorem ipsum dolor <b>sit</b> amet, <b class="important">consectetur adipiscing</b> elit,\ 
sed do eiusmod <span id="note">tempor incididunt ut</span> <div>labore <strong class="important">\
et dolore magna</strong> aliqua.</div> Ut enim ad minim veniam, quis nostrud exercitation ullamco."""

у вас есть идея для простого и короткого ответа? спасибо!

1 Ответ

0 голосов
/ 06 мая 2020

попробуйте использовать этот шаблон регулярного выражения

<[^>]*class="important"[^>]*>[^>]*<\/[^>]*>

если вы хотите удалить теги, вы можете использовать замену регулярного выражения с шаблоном:

<\/{0,1}[^>]*>

, если вы хотите попробовать шаблоны https://regexr.com Это отличный сайт, на котором выделяются совпадения, что упрощает задачу. пожалуйста, отметьте как ответ, если это вам поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...