потеря символов при переходе с юникода на ascii - PullRequest
0 голосов
/ 24 августа 2011

y0 У меня проблема с тем, что символы, включающие ñ или etc í ú и т. Д., Отбрасываются, когда я применяю

text = text.encode('ascii', 'ignore')

к функции, для которой ввод должен быть ascii.

Есть ли способ заставить его ascii без потери этих символов, или я должен изменить функцию, чтобы принимать символы Unicode?

http://dpaste.com/601417/

Ответы [ 2 ]

5 голосов
/ 24 августа 2011

Кодировка 'ascii' не может представлять символы, на которые вы ссылаетесь. Вы должны выбрать другую кодировку - возможно, 'cp850' или 'latin_1' - но тогда вы должны быть уверены, что ваш выходной терминал интерпретирует 8-битные коды, используя соответствующую кодовую страницу.

В целом, жизнь становится проще, если вы просто используете Unicode до конца.

0 голосов
/ 24 августа 2011

Да, вам следует перейти на другую кодировку, если вам нужны эти символы (например, Unicode).См. таблицу ascii для всех символов, включенных в ascii.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...