Парсер веб-страницы с использованием Python ничего не возвращает - PullRequest
0 голосов
/ 18 июня 2020

Добрый вечер! Приведенный ниже код ничего не возвращает, однако я ожидаю увидеть название продукта. Я думаю, что переменная заголовка неверна, однако я не уверен, что мне нужно исправить.

Любая помощь будет отличной,

Спасибо

import requests
from bs4 import BeautifulSoup

URL = 'https://www.amazon.co.uk/Razer-BlackWidow-Lite-Backlighting-Productivity/dp/B07KQR7RLH/ref=sr_1_1?crid=33KIPEXJU7JNK&dchild=1&keywords=blackwidow+lite&qid=1592502185&sprefix=blackwidow%2Caps%2C158&sr=8-1'

headers = {"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'}

page = requests.get(URL, headers=headers)

soup = BeautifulSoup(page.content, 'html.parser')

# print(soup.prettify())


title = soup.find(id="productTitle")

print(title)

1 Ответ

0 голосов
/ 18 июня 2020

Может попробовать это, возможно, он не сможет найти id productTitle, не зная, где он находится.

title  = soup.find('span', {'id':'productTitle'})

Вы также можете попробовать:

titleSection = soup.find('div', class_='a-section a-spacing-none')
title = titleSection.h1.span.text
...