Могу ли я объединить эти два блока в один:
Редактировать: Любой другой метод, кроме объединения циклов, как Yacoby в ответ.
for tag in soup.findAll(['script', 'form']):
tag.extract()
for tag in soup.findAll(id="footer"):
tag.extract()
Также я могу объединить несколько блоков в один:
for tag in soup.findAll(id="footer"):
tag.extract()
for tag in soup.findAll(id="content"):
tag.extract()
for tag in soup.findAll(id="links"):
tag.extract()
или, может быть, есть какое-то лямбда-выражение, где я могу проверить, есть ли в массиве, или любой другой более простой метод.
Также, как мне найти теги с атрибутом class, поскольку class является зарезервированным ключевым словом:
РЕДАКТИРОВАТЬ: эта часть решается с помощью soup.findAll (attrs = {'class': 'noprint'}):
for tag in soup.findAll(class="noprint"):
tag.extract()