import re
html = """<div class="linkTabBl" style="float:left;padding-top:6px;width:240px">
Anglo American plc
<br>
20 Carlton House Terrace
<br>
SW1Y 5AN London
<br>
United Kingdom
<br><br>
Phone : +44 (0)20 7968 8888
<br>
Fax : +44 (0)20 7968 8500
<br>
Internet :
<a class="pageprofil_link_blue" href="http://www.angloamerican.com" target="_blank">
http://www.angloamerican.com
</a>
<br>
</div>"""
res = re.findall(r'<br>\n ([a-zA-Z\s]+)?\n <br><br>', html)
print(res)
Примечание: "\ n" - это новая строка и 4 пробела от <'br'> до того, что вы ищете, до <'br'> снова,Так что если у вас есть что-то вроде этого:
...
<br>United Kingdom<br><br>
...
Вы должны заменить
res = re.findall(r'<br>\n ([a-zA-Z\s]+)?\n <br><br>', html)
на
res = re.findall(r'<br>([a-zA-Z\s]+)?<br><br>', html)
Хорошие уроки регулярных выражений здесь https://regexone.com/