Этот код для Web Scraping с использованием python возвращает None. Почему? Любая помощь будет оценена - PullRequest
0 голосов
/ 14 февраля 2020
from bs4 import BeautifulSoup

import requests

headers = {'Use-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/79.0.3945.130 Safari/537.36'}

url = 'https://www.amazon.com/Sony-Alpha-a6400-Mirrorless-Camera/dp/B07MV3P7M8/ref=sr_1_4?keywords=sony+alpha&qid=1581656953&s=electronics&sr=1-4'

page = requests.get(url,headers=headers)

soup = BeautifulSoup(page.content, 'html.parser')

title = soup.find(id="productTitle").get_text()

price = soup.find(id="priceblock_ourprice").get_text()

print(title)

print(price)

1 Ответ

0 голосов
/ 14 февраля 2020

Ваш код работает нормально, но перед страницей продукта есть проверка робота, поэтому ваш запрос ищет тег span на этой странице проверки робота, завершается неудачно и возвращает None.

Вот ссылка, которая может помочь вам: python запросы и обнаружение бота BeautifulSoup

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...