Я читаю файл, который содержит румынские слова в Python с помощью file.readline ().
У меня проблема со многими символами из-за кодировки.
Пример:
>>> a = "aberație" #type 'str'
>>> a -> 'abera\xc8\x9bie'
>>> print sys.stdin.encoding
UTF-8
Я пробовал encode () с utf-8, cp500 и т. Д., Но это не работает.
Я не могу найти правильную кодировку символов, которую я должен использовать?
спасибо заранее.
Редактировать: Цель состоит в том, чтобы сохранить слово из файла в словаре, а при печати - получить aberație, а не 'abera \ xc8 \ x9bie'