Question

Я пытаюсь найти неработающую ссылку в Selenium и Python, но получаю сообщение об ошибке в коде:

import requests
from selenium import webdriver

chrome_driver_path = "D:\\drivers\\chromedriver.exe"

driver=webdriver.Chrome(chrome_driver_path)

driver.get('https://google.co.in/')
links = driver.find_elements_by_css_selector("a")
images = driver.find_elements_by_css_selector("img")
for link in links:
    r = requests.head(link.get_attribute('href')
    print(r.status_code == 200)

Не удается найти неработающие ссылки на странице. Есть ли какое-то другое решение?

Получение:

увеличить MaxRetryError (_pool, url, error или ResponseError (причина)) urllib3.exceptions.MaxRetryError: HTTPSConnectionPool (host = 'myaccount.google.com', порт= 443): максимальное количество повторных попыток превышено с помощью url: /? Utm_source = OGB & utm_medium = app (вызвано SSLError (SSLEOFError (8, 'EOF произошел с нарушением протокола (_ssl.c: 777)'),))

Во время обработки вышеупомянутого исключения произошло другое исключение:

self._sslobj.do_handshake () ssl.SSLEOFError: EOF произошло с нарушением протокола (_ssl.c: 777)

Во время обработки вышеупомянутого исключения произошло другое исключение:

Traceback (последний последний вызов):

DebanjanB · Answer 1 · 25 мая 2018

Чтобы узнать статус ссылок на странице, вы можете использовать следующее решение:

Блок кода:

import requests
from selenium import webdriver

options = webdriver.ChromeOptions() 
options.add_argument("start-maximized")
options.add_argument('disable-infobars')
driver=webdriver.Chrome(chrome_options=options, executable_path=r'C:\Utility\BrowserDrivers\chromedriver.exe')
driver.get('https://google.co.in/')
links = driver.find_elements_by_css_selector("a")
for link in links:
    r = requests.head(link.get_attribute('href'))
    print(link.get_attribute('href'), r.status_code)

Выход консоли:

https://mail.google.com/mail/?tab=wm 302
https://www.google.co.in/imghp?hl=en&tab=wi 200
https://www.google.co.in/intl/en/options/ 301
https://myaccount.google.com/?utm_source=OGB&utm_medium=app 302
https://www.google.co.in/webhp?tab=ww 200
https://maps.google.co.in/maps?hl=en&tab=wl 302
https://www.youtube.com/?gl=IN 200
https://play.google.com/?hl=en&tab=w8 302
https://news.google.co.in/nwshp?hl=en&tab=wn 301
https://mail.google.com/mail/?tab=wm 302
https://www.google.com/contacts/?hl=en&tab=wC 302
https://drive.google.com/?tab=wo 302
https://www.google.com/calendar?tab=wc 302
https://plus.google.com/?gpsrc=ogpy0&tab=wX 302
https://translate.google.co.in/?hl=en&tab=wT 200
https://photos.google.com/?tab=wq&pageId=none 302
https://www.google.co.in/intl/en/options/ 301
https://docs.google.com/document/?usp=docs_alc 302
https://books.google.co.in/bkshp?hl=en&tab=wp 200
https://www.blogger.com/?tab=wj 405
https://hangouts.google.com/ 302
https://keep.google.com/ 302
https://earth.google.com/web/ 200
https://www.google.co.in/intl/en/options/ 301
https://accounts.google.com/ServiceLogin?hl=en&passive=true&continue=https://www.google.co.in/ 200
https://www.google.co.in/webhp?hl=en&sa=X&ved=0ahUKEwj0qNPqnqHbAhXYdn0KHXpeAo0QPAgD 200

hamed baziyad · Answer 2 · 10 марта 2019

from selenium import webdriver
chrome_driver_path = "D:\\drivers\\chromedriver.exe"
driver=webdriver.Chrome(chrome_driver_path)
import requests
for link in links:
    r = requests.head(link)
    if r.status_code!=404:
         driver.get(link)
    else:
          print(str(link) + " isn't available.")

Murthi · Answer 3 · 25 мая 2018

Из-за Вас отсутствует закрывающая скобка в строке ниже или это опечатка?

r = requests.head(link.get_attribute('href'))

Как найти неработающие ссылки в Selenium + Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как найти неработающие ссылки в Selenium + Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов