Регулярные выражения не страшны, но написание собственных регулярных выражений для удаления HTML - верный путь к безумию (и оно тоже не будет работать). Следуйте по пути мудрости и используйте одну из множества хороших библиотек HTML-парсинга.
Пример Лукаса также не работает, потому что «sub» не является методом строки Python. Вам нужно будет "импортировать re", а затем вызвать re.sub (pattern, repl, string). Но это ни здесь, ни там, поскольку правильный ответ на ваш вопрос не предполагает написания каких-либо регулярных выражений.