Я пытаюсь получить элементы в HTML-документе, которые содержат следующий шаблон текста: # \ S {11}
<h2> this is cool #12345678901 </h2>
Итак, предыдущий будет соответствовать с помощью:
soup('h2',text=re.compile(r' #\S{11}'))
И результаты будут примерно такими:
[u'blahblah #223409823523', u'thisisinteresting #293845023984']
Я могу получить весь соответствующий текст (см. Строку выше). Но я хочу, чтобы родительский элемент текста совпадал, поэтому я могу использовать его в качестве отправной точки для обхода дерева документа. В этом случае я бы хотел, чтобы возвращались все элементы h2, а не совпадения текста.
Идеи