Я новичок в очистке веб-страниц и пытаюсь удалить конкретный веб-сайт с определенными параметрами. Теперь я хочу получить div, который удовлетворяет следующим условиям:
Я хочу исключить div
, в котором есть определенные class
.
Я хочу исключить div
, который не имеет атрибута class
.
Я хочу включить div
, который имеет конкретный id
и ни один из них не имеетУ меня есть какой-либо класс или у него есть класс, отличный от списка игнорируемых классов.
Теперь я выполнил 2 условия, выполнив следующий код :
classToIgnore = ["class1", "class2", "class3"]
for div in soup.find_all('div', class_=lambda x: x in classToIgnore):
div.decompose()
for div in soup.find_all('div', class_=False):
div.decompose()
Теперь я не знаю, как добавить здесь 3-е условие, а также хочу сделать все 3 фильтра в одном выражении find_all()
, если это возможно.