Вы получаете Unicode-строки из парсера.Вы можете заменить некоторые символы, если вы предпочитаете других.Например, ваш \xa0
является неразрывным пробелом, и вы можете заменить его обычным пробелом:
text = text.replace(u"\xa0", u" ")
Может быть много таких символов, которые вы хотите изменить, поэтому это может бытьдолгий процесс поиска всех тех, которые встречаются в ваших данных.