Веб-сканирование изображений через py jupyter - PullRequest
0 голосов
/ 14 июля 2020

Я пытаюсь очистить веб-изображения с этого URL-адреса через py в jupyter: https://www.adobe.com/products/catalog.html?sort=name&types=pf_252Fdesktop&types=pf_252Fmobile&types=pf_252Fweb&page=1, но при запуске приведенного ниже кода я получил эту ошибку:

import requests from bs4 
import BeautifulSoup 
# download page page = "adobe.com/products/…" result = requests.get(page) 
# if successful parse the download into a BeautifulSoup object, which allows easy manipulation 
if result.status_code == 200: soup = BeautifulSoup(result.content, "html.parser")

Error: SSLError: HTTPSConnectionPool(host='www.adobe.com', port=443): Max retries exceeded with url: /products/catalog.html?sort=name&types=pf_252Fdesktop&types=pf_252Fmobile&types=pf_252Fweb&page=1 (Caused by SSLError(SSLError("bad handshake: Error([('SSL routines', 'tls_process_server_certificate', 'certificate verify failed')])")))

Есть предложения по исправлению ошибки, в чем root проблема? Спасибо

1 Ответ

0 голосов
/ 14 июля 2020
In [23]: res = requests.get("https://www.adobe.com/products/catalog.html?sort=name&types=pf_252Fdesktop&types=pf_252Fm
    ...: obile&types=pf_252Fweb&page=1", verify=False)
/Users/abhilash.kr/anaconda3/envs/py37/lib/python3.7/site-packages/urllib3/connectionpool.py:1004: InsecureRequestWarning: Unverified HTTPS request is being made. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#ssl-warnings
  InsecureRequestWarning,

In [24]: res
Out[24]: <Response [200]>

Вам необходимо использовать verify=False в вашем get методе

...