Я думаю, что в вашей строке есть косые черты, а не символы Юникода.
То есть \u00ea
- это escape-кодировка Unicode для ê
, но \\u00ea
на самом деле является косой чертой (экранированная), два нуля и две буквы.
Аналогично для кавычек, ваши первые и последние символы - это буквальные двойные кавычки "
.
Вы можете преобразовать эти косая черта плюс кодовая точка в эквивалентные им символы:
x = '"temp\\u00eate de poussi\\u00e8res"'
d = x.decode("unicode_escape")
print d
Вывод:
"tempête de poussières"
Обратите внимание, что для просмотра правильных международных символов необходимо использовать печать.Если вместо этого вы просто напишите d
в интерактивной оболочке Python, вы получите:
u'"temp\xeate de poussi\xe8res"'
, где \xea
эквивалентно \u00ea
, то есть escape-последовательности для ê
.
Удаление цитат, если необходимо, оставлено читателю в качестве упражнения; -).