Я пытаюсь очистить списки с Autotrader.com, используя следующий код:
import requests
session = requests.Session()
url = 'https://www.autotrader.com/cars-for-sale/Burlingame+CA-94010?searchRadius=10&zip=94010&marketExtension=include&isNewSearch=true&sortBy=relevance&numRecords=25&firstRecord=0'
homepage = session.get(url)
Похоже, соединение было успешно установлено:
In[115]: homepage
Out[115]: <Response [200]>
Однако доступ к содержимое домашней страницы показывает сообщение об ошибке и ничего похожего на содержимое, доступное через браузер:
In[121]: homepage.content
Out[121]:
<!DOCTYPE html>
<html lang="en" xml:lang="en" xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>Autotrader - page unavailable</title>
(...)
<h1>We're sorry for any inconvenience, but the site is currently unavailable.</h1>
(...)
Я попытался добавить другой пользовательский агент в заголовки, используя user_agent :
headers = {'User-Agent': generate_user_agent()}
homepage = session.get(url, headers=headers)
Но получите тот же результат: page unavailable
Я также попытался указать на сертификат безопасности (root один?), Который я скачал с Chrome:
certificate = './certificate/root.cer'
homepage = session.get(url, headers=headers, verify=certificate)
но я вижу ошибку:
File "/Users/michaelboles/Applications/anaconda3/lib/python3.7/site-packages/OpenSSL/_util.py", line 54, in exception_from_error_queue
raise exception_type(errors)
Error: [('x509 certificate routines', 'X509_load_cert_crl_file', 'no certificate or crl found')]
Так что, возможно, я неправильно выполняю эту последнюю часть.
Может ли кто-нибудь предложить какую-либо помощь по восстановлению содержимого веб-страницы Autotrader как это отображается в браузере?