Элементы привязки, которые являются ссылками для просмотра сведений о колледже, имеют атрибут id
, который начинается с ContentPlaceHolder1_dlstCollege_
. Так что передайте это как регулярное выражение в attrs
аргумент из find_all()
:
import re
for anchor in table.findAll('a', attrs={"id": re.compile("^ContentPlaceHolder1_dlstCollege_.*")}):
...
Вы также можете просто передать это как id
аргумент ключевого слова to find_all()
:
for anchor in table.findAll('a', id=re.compile("^ContentPlaceHolder1_dlstCollege_.*")):
...
Регулярное выражение можно сделать еще более конкретным c, например "^ContentPlaceHolder1_dlstCollege_hlpkInstituteName_.*"
, которое должно соответствовать только ссылке, предоставленной с названием колледжа.
( Я бы удалил [1:]
, который вы поставили в конце, поскольку это, вероятно, отфильтровывает ссылку в начале, которую вы не хотите. Если это не так, добавьте его обратно.)