Я пытаюсь очистить Amazon с помощью python-3.7. Я получаю это сообщение.
«Извините, нам просто нужно убедиться, что вы не робот. Для достижения наилучших результатов, пожалуйста, убедитесь, что ваш браузер принимает куки».
Как заставить питона принимать куки? Когда я найду решение, должен ли я отказаться от IP-адреса, которым я сейчас пользуюсь?
from requests_html import HTML
from requests_html import HTMLSession
import sys
import warnings
session = HTMLSession()
if not sys.warnoptions:
warnings.simplefilter("ignore")
headers = {
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36'
}
amazon_url="https://www.amazon.com/dp/B00002N6SD"
response = session.get(amazon_url, headers=headers, verify=False) #get the response
print (response.content)
title = response.html.find('#productTitle')
print (title)
exit()
Я ожидаю содержания и элемента. Я получаю контент в первый раз, но впоследствии получаю сообщение и captiva. Если я подожду некоторое время, я снова получу контент.