Я пытаюсь почистить веб-сайт.
У меня проблема с bs4.BeautifulSoup
:
for i in range(len(links)):
linksRes = requests.get(links[i])
linksRes.raise_for_status()
linksSoup = bs4.BeautifulSoup(linksRes.text, 'lxml')
for e in linksSoup.find_all(href=re.compile(r'/especial/example')):
otroProducto.append(e.get('href'))
for i in range(len(otroProducto)):
detalleRes = requests.get('http://www.example.com' + otroProducto[i])
detalleRes.raise_for_status()
detalleSoup = bs4.BeautifulSoup(detalleRes.text, 'lxml')
Дело в том, что первый bs4.BeautifulSoup
возвращает"class 'bs4.BeautifulSoup'"
как я и ожидал, но второй возвращает пустой тип "list"
.
Я думаю, это как-то связано с конкатенацией строк, которые я там делаю, но я просто не могу понять, как сделать это типом BeautifulSoup, чтобы иметь возможность извлекать нужную мне информацию.