Я предлагаю использовать хороший анализатор HTML (например, BeautifulSoup ), но для ваших целей, например, с правильно сформированным HTML в качестве входных данных, которые поставляются со стандартной библиотекой Python, например HTMLParser , также должен хорошо работать), а не необработанные RE для анализа HTML.
Если вы хотите сохранить постоянный подход RE, шаблон:
r'<div class="deg">([^<]*)</div>'
выглядит как самый простой способ вывести строку 'DATA' из строки '<div class="deg">DATA</div>
' - при условии, что это то, что вам нужно. Возможно, вам придется добавить один или несколько \s*
в те места, где вам нужно допускать дополнительные пробелы.