Я наконец-то получил хорошее решение:
def clean_line(line):
return re.sub(r'[ ]{2,}', ' ', re.sub(r'[\r\n]', '', line))
html_content = get_html_div_from_above()
para = BeautifulSoup(html_content)
''.join([clean_line(line) for line in para.findAll(text=True)])
Какие выходы:
u'Available in French and English. '