Получить href используя xpath + id - PullRequest
0 голосов
/ 20 ноября 2018

У меня есть список результатов поиска 9 результатов поиска с этого сайта , и я хотел бы получить ссылку href для каждого элемента в результатах поиска.

Здесьxpath и селекторы ссылок на 1-й, 2-й и 3-й элементы:

'//*[@id="search-results"]/div[4]/div/ctl:cache/div[3]/div[1]/div/div[2]/div[2]/div[2]/p[4]/a'

#search-results > div.c_408104 > div > ctl:cache > div.product-list.grid > div:nth-child(8) > div > div.thumbnail > div.caption.link-behavior > div.caption > p.description > a


'//*[@id="search-results"]/div[4]/div/ctl:cache/div[3]/div[2]/div/div[2]/div[2]/div[2]/p[4]/a'

#search-results > div.c_408104 > div > ctl:cache > div.product-list.grid > div:nth-child(13) > div > div.thumbnail > div.caption.link-behavior > div.caption > p.description > a


'//*[@id="search-results"]/div[4]/div/ctl:cache/div[3]/div[4]/div/div[2]/div[2]/div[2]/p[2]/a'

#search-results > div.c_408104 > div > ctl:cache > div.product-list.grid > div:nth-child(14) > div > div.thumbnail > div.caption.link-behavior > div.caption > p.description > a

Я пробовал:

browser.find_elements_by_xpath("//a[@href]")

, но это возвращает все ссылки на странице, а не толькорезультаты поиска.Я также пытался использовать идентификатор, но не уверен, каков правильный синтаксис.

browser.find_elements_by_xpath('//*[@id="search-results"]//a')

1 Ответ

0 голосов
/ 20 ноября 2018

То, что вы хотите, это attribute="href" всех результатов ...

Итак, я покажу вам пример:

from selenium import webdriver
from selenium.webdriver.chrome.options import Options


url = 'https://www.costco.com/sofas-sectionals.html'

chrome_options = Options()
chrome_options.add_argument("--start-maximized")
browser = webdriver.Chrome("C:\workspace\TalSolutionQA\general_func_class\chromedriver.exe",
                           chrome_options=chrome_options)


browser.get(url)
result_xpath = '//*[@class="caption"]//a'
all_results = browser.find_elements_by_xpath(result_xpath)
for i in all_results:
    print(i.get_attribute('href'))

Итак, что я делаю здесьпросто получая все известные мне элементы, чтобы иметь ссылки и сохраняя их в all_results, теперь в селене у нас есть метод get_attribute для извлечения необходимого атрибута.

Надеюсь, вы найдете это полезным!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...