Механизация - это библиотека python, которая позволяет выполнять http-запросы и даже предоставляет некоторую возможность для анализа html и извлечения данных, которые вы ищете.Его главная особенность заключается в том, что он может работать как браузер и обрабатывать такие вещи, как аутентификация и файлы cookie.
Regex не идеален при работе с XML / HTML (вы увидите).Вы можете использовать BeautifulSoup в сочетании с Mechanize, если вы предпочитаете эту библиотеку анализа.Изучение таких вещей, как XPath, также может упростить вашу жизнь.
Как по механизму, так и по BeautifulSoup есть учебники, так что начните читать код!