Найти все ссылки внутри таблицы - PullRequest
2 голосов
/ 09 февраля 2011

Моя html-страница имеет:

...
<table class="t1" ..>
<tr><td> ... <a href="">...</a> ... <a href="">..</a>
</table>

...

У меня есть:

html = BeautifulSoup(page)

links = html.findAll('a', ?????????)

Как мне найти все ссылки, которые находятся внутри этой таблицы?

Ответы [ 3 ]

5 голосов
/ 09 февраля 2011

Найдите таблицу (в данном случае по классу ), затем найдите все ссылки в ней.

html = BeautifulSoup(page)
table = html.find('table', 't1')
links = table.findAll('a')
1 голос
/ 09 февраля 2011

Более эффективно, чем необработанная находка, используйте SoupStrainer:

html  = BeautifulSoup(page, parseOnlyThese=SoupStrainer('table', 't1' ) )
links = html.findAll('a')

См. Также, Поиск по документации по классам .

0 голосов
/ 09 февраля 2011

Это должно вернуть список ссылок на странице

html = BeautifulSoup(page)
links = html.findAll('a')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...