парсинг веб-сайтов с использованием селена, возвращающий несколько веб-доменов - PullRequest
0 голосов
/ 08 мая 2020

Мне нужно выполнить несколько запросов на этом сайте и вернуть мне статус предложения или покупки, однако мой код возвращает неожиданное значение https://instantdomainsearch.com/en/#search = gmail.com , но мой код не может вставить другая ссылка, есть идеи, как решить эту проблему?

domains = ['gmail.com','hotmail']
#scrape elements
ff = webdriver.Firefox(executable_path="D:/Programas/gecko/geckodriver.exe")

for domain in domains:
    ff.get('https://instantdomainsearch.com/pt/#search='+str(domains))
    html = ff.page_source
    soup = BeautifulSoup(html,'html.parser')
    list_ = soup.find('div', {'class':'awrzayw'})
    elements = list_.find('a')

    try:
       elements = list_.find('a')
    except:
       elements = "comprar"

    for element in elements:
       print(element)

enter image description here

1 Ответ

1 голос
/ 08 мая 2020

Ваша проблема возникает в этой строке. Изначально вы звонили в домены. Вы перебираете домены, поэтому используйте отдельный элемент.

ff.get('https://instantdomainsearch.com/pt/#search='+str(domains))

domains = ['gmail.com','hotmail']
#scrape elements
ff = webdriver.Firefox(executable_path="D:/Programas/gecko/geckodriver.exe")

for domain in domains:
    ff.get('https://instantdomainsearch.com/pt/#search='+ domain)
    html = ff.page_source
    soup = BeautifulSoup(html,'html.parser')
    list_ = soup.find('div', {'class':'awrzayw'})
    elements = list_.find('a')

    try:
       elements = list_.find('a')
    except:
       elements = "comprar"

    for element in elements:
       print(element)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...