Невозможно очистить содержимое зацикленных страниц (следующая страница) - PullRequest
0 голосов
/ 06 июня 2019

Я пытался очистить сайт, разбитый на селен питон. Код, который я написал, смог извлечь данные с первой страницы, а также перейти на страницу 2, но не смог извлечь содержимое 2-й страницы и остальных страниц.

Я получил результат только на странице 1

from selenium import webdriver
import time
browser = webdriver.Chrome(executable_path='C:\Python27\Scripts\chromedriver.exe')



browser.get("https://www.etsy.com/ca/c/jewelry/necklaces" )


posts= browser.find_elements_by_class_name("text-gray")

for post in posts:

  print post.text

for i in range(1,3):
   u=browser.get('https://www.etsy.com/ca/c/jewelry/necklaces?ref=pagination&page=%s' % str(i))

   print".................................."+ str(i)+"......................................."
time.sleep(10)   
new= u.find_element_by_class_name("text-gray")
for we in new:
   print we.text

Это сообщение об ошибке, которое я получил: AttributeError: 'NoneType' object has no attribute 'find_elements_by_class_name

1 Ответ

1 голос
/ 06 июня 2019

Попробуйте это:

from selenium import webdriver 

import time 

browser = webdriver.Chrome(executable_path='C:\Python27\Scripts\chromedriver.exe')
browser.get("https://www.etsy.com/ca/c/jewelry/necklaces" )
posts= browser.find_elements_by_class_name("text-gray")

for post in posts:
    print post.text

for i in range(1,3):
    gets = 'https://www.etsy.com/ca/c/jewelry/necklaces?ref=pagination&page='+str(i)
    u = browser.get(gets)
    time.sleep(10)
    new = u.find_element_by_class_name("text-gray") 
    for we in new: 
        print we.text
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...