Вы можете использовать BeautifulSoup для анализа HTML, а для каждого тега <a>
используйте tag.attrs
, чтобы прочитать атрибуты:
In [111]: soup = BeautifulSoup.BeautifulSoup('<a href="xyz" title="xyz">xyz</a>')
In [112]: [tag.attrs for tag in soup.findAll('a')]
Out[112]: [[(u'href', u'xyz'), (u'title', u'xyz')]]