Я часами пытался найти способ сделать это, и пока ничего не нашел. Я попытался использовать элемент поиска по css, xpath и частичному тексту, используя функцию not. Я пытаюсь отсканировать веб-страницу для всех ссылок, которые не содержат слово «google», и добавить их в массив.
Имейте в виду, что говорить и get_audio - это отдельные функции, которые я не включил.
driver = webdriver.Chrome(executable_path='mypath')
url = "https://www.google.com/search?q="
driver.get(url + text.lower())
speak("How many articles should I pull?")
n = get_audio()
speak(f"I'll grab {n} articles")
url_array = []
for a in driver.find_elements_by_xpath("//*[not(contains(text(), 'google'))]"):
url_array.append(a.get_attribute('href'))
print(url_array)
Я всегда получаю что-то, что find_elements_ * не может взять (что бы я здесь ни указывал), или оно работает, но оно добавляет все в массив, даже те, в которых есть google. У кого-нибудь есть идеи? Спасибо!