Это довольно простое требование, когда дело доходит до разбора HTML.Стандартная библиотека Python включает в себя модуль ElementTree , который должен помочь выполнить задачу, которую вы планируете выполнить.Посмотрите на фрагмент кода, который приведен на этой странице.
Кроме того, никогда не допускает ошибку в разборе HTML / XML с помощью регулярных выражений.Вы можете не знать, когда это станет безумно сложным, и это плохая идея в любой ситуации.