Question

Я пытаюсь почистить веб-сайт.

У меня проблема с bs4.BeautifulSoup:

for i in range(len(links)):
    linksRes = requests.get(links[i])                                           
    linksRes.raise_for_status()                                                 
    linksSoup = bs4.BeautifulSoup(linksRes.text, 'lxml')                        
    for e in linksSoup.find_all(href=re.compile(r'/especial/example')):
                                otroProducto.append(e.get('href'))              

for i in range(len(otroProducto)):
    detalleRes = requests.get('http://www.example.com' + otroProducto[i])
    detalleRes.raise_for_status()
    detalleSoup = bs4.BeautifulSoup(detalleRes.text, 'lxml')

Дело в том, что первый bs4.BeautifulSoup возвращает"class 'bs4.BeautifulSoup'" как я и ожидал, но второй возвращает пустой тип "list".

Я думаю, это как-то связано с конкатенацией строк, которые я там делаю, но я просто не могу понять, как сделать это типом BeautifulSoup, чтобы иметь возможность извлекать нужную мне информацию.

bs4.BeautifulSoup (), возвращающий <class 'list'>?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

bs4.BeautifulSoup (), возвращающий <class 'list'>?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов