Как бы я поцарапать Google, но игнорировать ссылки, которые находятся в разделе "Люди также спрашивают" - PullRequest
0 голосов
/ 05 июня 2019

Я хочу почистить ссылки Google, но игнорирую ссылки, которые есть в разделе "Люди также спрашивают" ... как показано здесь. зеленый - это ссылка, которую я хочу очистить, красный - это ссылка, которую я хочу игнорировать

enter image description here

driver.get("https://www.google.com/search?q=" + str(word))

links = driver.find_elements_by_css_selector('div.g')
for link in links:
    link = link.find_element_by_tag_name("a")
    href = link.get_attribute("href")
    print(href)

Это в основном распечатывает все цветные ссылки зеленого текста (не мои цвета с цветовой кодировкой)

1 Ответ

0 голосов
/ 05 июня 2019

Люди также спрашивают В разделе есть дополнительные классы для g, вы можете найти элементы без этих классов, используя :not()

links = driver.find_elements_by_css_selector('div.g:not(.kno-kp)')

Или без атрибута data-hveid

links = driver.find_elements_by_css_selector('div.g:not([data-hveid])')
...