Соответствующие ссылки что? Их атрибут HREF? Текст ссылки отображается?
Возможно что-то вроде:
from BeautifulSoup import BeautifulSoup, SoupStrainer
import re
import urllib2
doc = urllib2.urlopen("http://somesite.com").read()
links = SoupStrainer('a', href=re.compile(r'^test'))
soup = [str(elm) for elm in BeautifulSoup(doc, parseOnlyThese=links)]
for elm in soup:
print elm
Это захватит HTML-содержимое somesite.com
и затем проанализирует его с помощью BeautifulSoup, ища только ссылки, атрибут HREF которых начинается с «test». Затем он создает список этих ссылок и распечатывает их.
Вы можете изменить это, чтобы сделать что-нибудь, используя документацию .