я пытаюсь собрать все ссылки в списке оружия (в данном случае 2 страницы) и распечатать 1) длину и 2) сами ссылки.
im получаю ошибку: у объекта списка нет атрибутавыберите
from bs4 import BeautifulSoup
import requests
import csv
import pandas
from pandas import DataFrame
import re
import os
import locale
os.environ["PYTHONIOENCODING"] = "utf-8"
page = 1
all_links = []
url="https://www.gunstar.co.uk/view-trader/global-rifle-snipersystems/58782?page={}"
with requests.Session() as session:
while True:
print(url.format(page))
res=session.get(url.format(page))
soup=BeautifulSoup(res.content,'html.parser')
gun_details = soup.select('div.details')
for link in gun_details.select('a'):
all_links.append("https://www.gunstar.co.uk" + link['href'])
if len(soup.select(".nav_next"))==0:
break
page += 1
Если я удаляю .content из ответа, я получаю ответ не имеет len.
, если я добавляю .text в soup.select ('div.details') iполучить результат, аналогичный приведенному выше.
Я уверен, что он идет не так, как надо, где-то довольно просто, просто не могу это увидеть - есть ли причина, почему select и findAll не работают при попытке попасть в определенную часть html?