Получить содержимое тега с красивым супом - PullRequest
1 голос
/ 04 марта 2011

У меня есть этот html:

<a href="/watch?gl=US&amp;client=mv-google&amp;hl=en&amp;v=0C_yXOhJxWg">Miss Black OCU 2011</a>

Моя программа читает html-файл, и над ним находится фрагмент этого файла.Как извлечь «Miss Black OCU 2011» с помощью BeautifulSoup в python.

1 Ответ

3 голосов
/ 04 марта 2011

Вот быстрое решение:

>>> from BeautifulSoup import BeautifulSoup as BS
>>> soup = BS('<a href="/watch?gl=US&amp;client=mv-google&amp;hl=en&amp;v=0C_yXOhJxWg">Miss Black OCU 2011</a>')
>>> tags = soup.findAll('a', href=True)
>>> for tag in tags: tag.renderContents() 
'Miss Black OCU 2011'
>>> 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...