Нельзя с пользой анализировать HTML с помощью регулярного выражения. Если вы заранее знаете формат страницы - например,
- ссылки всегда имеют вид или
- все ссылки являются абсолютными, и никакие другие строки, не связанные с ссылками, начинающиеся с http: существуют
тогда вы можете сойти с рук, но для обычного [X] HTML парсер регулярных выражений не подходит.
В зависимости от того, какой язык вы используете, вам нужно будет найти либо библиотеку синтаксического анализатора HTML (например, BeautifulSoup Python), либо уровень HTML-кода в сочетании со стандартным синтаксическим анализатором XML, а затем отсканировать документ на наличие элементов (и, может быть, другие, например,
, если вы заинтересованы в них?), затем разделите значение атрибута на «?».