У меня есть css-селектор, который отлично работает при выполнении его в консоли chrome JS, но не работает при запуске через BeautifulSoup в одном примере, но работает в другом (я не могу различить разницу между ними) ,
url_1 = 'https://www.amazon.com/s?k=bacopa&page=1'
url_2 = 'https://www.amazon.com/s?k=acorus+calamus&page=1'
Следующий запрос отлично работает на обоих при выполнении его в консоли Chrome.
document.querySelectorAll('div.s-result-item')
Затем, запустив два URL-адреса через BeautifulSoup, получаю вывод.
url_1 (работает)
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'}
r = requests.get(url_1, headers=headers)
soup = BeautifulSoup(r.content, 'html.parser')
listings = soup .select('div.s-result-item')
print(len(listings))
вывод: 53 (правильно)
url_2 (не работает)
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'}
r = requests.get(url_2, headers=headers)
soup = BeautifulSoup(r.content, 'html.parser')
listings = soup.select('div.s-result-item')
print(len(listings))
вывод: 0 (неверно - ожидается: 49)
Кто-нибудь знает, что здесь может происходить и как мне заставить селектор css работать с beautifulsoup?