Поиск по содержимому тега с BeautifulSoup - PullRequest
1 голос
/ 29 августа 2011

Я бы хотел найти определенный тег по его текстовому содержимому. Например:

<a href="http://goinghere.com">Lets go somewhere</a>

Я хочу найти вышеупомянутое, ища текст «Пойдем куда-нибудь». В настоящее время я делаю это с помощью ре. Это можно сделать в BeautifulSoup или лучше использовать re в этом случае?

1 Ответ

1 голос
/ 29 августа 2011
s = BeautifulSoup(...)
s.find(text='Lets go somewhere')

Вы также можете использовать регулярные выражения.

Использование BeautifulSoup для поиска тега HTML, содержащего определенный текст

Редактировать: Хотя метод find печатает строку, если вы используете ее в командной строке, на самом деле это просто представление возвращаемого объекта; вы можете получить к нему доступ к родительскому атрибуту, чтобы получить доступ к его тегу BeautifulSoup.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...