Python и Selenium начинающий здесь. Я пытаюсь вычеркнуть заголовки разделов класса Udemy. Я пытался использовать find_elements_by_class_name и другие, но по какой-то причине возвращает только частичные данные.
страница, которую я очищаю: https://www.udemy.com/selenium-webdriver-with-python3/
1) Я хочу получить заголовок разделов. Это смелые названия.
2) Я хочу получить название подразделов.
from selenium import webdriver
driver = webdriver.Chrome()
url = 'https://www.udemy.com/selenium-webdriver-with-python3/'
driver.get(url)
main_titles = driver.find_elements_by_class_name("lecture-title-text")
sub_titles = driver.find_elements_by_class_name("title")
Задача
1) Используя main_titles, я получил длину только 10. Она идет только от введения к модулям. Работа с файлами, а те, в конце концов, не выходят. Тем не менее, имена классов точно такие же. Не уверен, почему это не так. Modules / WorkingWithFiles - это точка отсечения. Элементы в инспекции также выглядит по-другому на этом этапе. Все они имеют одинаковый тег класса span, но не уверены, почему возвращается только частичное
<span class="lecture-title-text">
Проверка элементов между заголовком модулей и заголовком WorkingWithFiles
В этот момент веб-скребок разрушается. Не уверен почему.
2) Используя субтитры, я получил длину 58 элементов, но когда я распечатывал их, я получал только два верхних:
Introduction
How to reach me anytime and ask questions? *** MUST WATCH ***
После этого все пустые строки. Не уверен, почему он тянет только две верхние, а не остальные, когда все теги имеют
<div class='title'>
Возможно, я мог бы попытаться использовать BeautifulSoup, но в настоящее время я пытаюсь стать лучше, используя Selenium. Есть ли динамическое содержание, выбрасывающее царапину селена, или я не очищаю ее должным образом?
Спасибо, ребята, за вклад. Простите за длинный пост. Я хотел убедиться, что я правильно описал проблему.