Что мне нужно передать как шаблон регулярных выражений, чтобы получить HTML и PDF с веб-страницы HTML?Пока что у меня ниже.Я предположил, что мне нужно использовать оператор OR, но это не сработало так, как ожидалось.
status, response = http.request("http://www.example.com")
htmlandpdfonly=SoupStrainer('a', href=re.compile('html|pdf'))
for link in BeautifulSoup(response, parseOnlyThese = htmlandpdfonly):
if(link.has_key('href')):
print link['href']