Что это за кодировка и как я могу ее декодировать? - PullRequest
0 голосов
/ 04 декабря 2011

У меня есть старый файл проекта с переводами на португальский язык, где не работают специальные символы:

error.text.required=\u00C9 necess\u00E1rio o texto.
error.categoryid.required=\u00C9 necess\u00E1ria a categoria.
error.email.required=\u00C9 necess\u00E1rio o e-mail. 
error.email.invalid=O e-mail \u00E9 inv\u00E1lido.
error.fuel.invalid=\u00C9 necess\u00E1rio o tipo de combust\u00EDvel.
error.regdate.invalid=\u00C9 necess\u00E1rio ano de fabrica\u00E7\u00E3o.
error.mileage.invalid=\u00C9 necess\u00E1ria escolher a quilometragem.
error.color.invalid=\u00C9 necess\u00E1ria a cor.

Можете ли вы сказать мне, как декодировать файл, чтобы использовать обычные португальские буквы?

Спасибо

Ответы [ 2 ]

2 голосов
/ 04 декабря 2011

«\ u» - это префикс для юникода. Вы можете использовать строки «как есть», и вы увидите диакритические знаки в выводе. Код Python будет выглядеть примерно так:

print u"\u00C9 necess\u00E1rio o texto."

который выводит:

É Необходимость в тексте.

В противном случае вам необходимо преобразовать их в эквиваленты ASCII. Вы можете сделать простой поиск / замену. Я закончил писать такую ​​функцию для преобразования румынских диакритических знаков некоторое время назад, но у меня появились динамические строки ...

0 голосов
/ 04 декабря 2011

Запах для меня, как будто это Unicode?

\ u = префиксный символ Unicode

00E1 = шестнадцатеричный код для 2-байтового номера Unicode.

Не уверенчто это за формат - я бы спросил у sencer, но я бы попробовал этот подход для его декодирования.


нашел его;) http://www.fileformat.info/info/unicode/char/20/index.htm

Посмотрите на таблицы с исходным кодом,Это может быть исходный файл C ++.Именно так вы даете символы юникода в исходном коде.

...