Как обойти проблему Python «Сообщения WindowsError неправильно закодированы»? - PullRequest
4 голосов
/ 19 апреля 2010

Проблема, когда Python вызывает WindowsError, кодировка сообщения об исключении всегда кодируется os-native. Например:

import os
os.remove('does_not_exist.file')

Ну, здесь мы получаем исключение:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
WindowsError: [Error 2] 系統找不到指定的檔案。: 'does_not_exist.file'

Поскольку мой язык Windows7 - традиционный китайский, я получаю сообщение об ошибке по умолчанию в кодировке big5 (известной как CP950).

>>> try:
...     os.remove('abc.file')
... except WindowsError, value:
...     print value.args
...
(2, '\xa8t\xb2\xce\xa7\xe4\xa4\xa3\xa8\xec\xab\xfc\xa9w\xaa\xba\xc0\xc9\xae\xd7\xa1C')
>>>

Как вы видите здесь, сообщение об ошибке не Unicode, тогда я получу еще одно исключение кодирования, когда я попытаюсь распечатать его. Вот проблема, она может быть найдена в списке проблем Python: http://bugs.python.org/issue1754

Вопрос в том, как обойти это? Как получить нативную кодировку WindowsError? Я использую версию Python 2.6.

Спасибо.

Ответы [ 3 ]

4 голосов
/ 21 апреля 2010

У нас такая же проблема в русской версии MS Windows: кодовая страница локали по умолчанию cp1251, но кодовая страница консоли Windows по умолчанию cp866:

>>> import sys
>>> print sys.stdout.encoding
cp866
>>> import locale
>>> print locale.getdefaultlocale()
('ru_RU', 'cp1251')

Решение должно заключаться в декодировании сообщения Windows с кодировкой локали по умолчанию:

>>> try:
...     os.remove('abc.file')
... except WindowsError, err:
...     print err.args[1].decode(locale.getdefaultlocale()[1])
...

Плохая новость заключается в том, что вы все еще не можете использовать exc_info=True в logging.error().

0 голосов
/ 20 апреля 2010

Это просто строка repr () того же сообщения об ошибке. Поскольку ваша консоль уже поддерживает cp950, просто распечатайте нужный компонент. Это работает в моей системе после перенастройки для использования cp950 в моей консоли. Мне пришлось явно поднять сообщение об ошибке, так как моя система на английском, а не на китайском:

>>> try:
...     raise WindowsError(2,'系統找不到指定的檔案。')
... except WindowsError, value:
...     print value.args
...
(2, '\xa8t\xb2\xce\xa7\xe4\xa4\xa3\xa8\xec\xab\xfc\xa9w\xaa\xba\xc0\xc9\xae\xd7\xa1C')
>>> try:
...     raise WindowsError(2,'系統找不到指定的檔案。')
... except WindowsError, value:
...     print value.args[1]
...
系統找不到指定的檔案。

Либо используйте Python 3.X. Он печатает repr () с использованием кодировки консоли. Вот пример:

Python 2.6.5 (r265:79096, Mar 19 2010, 21:48:26) [MSC v.1500 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> '系統找不到指定的檔案。'
'\xa8t\xb2\xce\xa7\xe4\xa4\xa3\xa8\xec\xab\xfc\xa9w\xaa\xba\xc0\xc9\xae\xd7\xa1C'

Python 3.1.2 (r312:79149, Mar 21 2010, 00:41:52) [MSC v.1500 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> '系統找不到指定的檔案。'
'系統找不到指定的檔案。'
0 голосов
/ 19 апреля 2010

sys.getfilesystemencoding() должно помочь.

import os, sys
try:
    os.delete('nosuchfile.txt')
except WindowsError, ex:
    enc = sys.getfilesystemencoding()
    print (u"%s: %s" % (ex.strerror, ex.filename.decode(enc))).encode(enc)

Для других целей, кроме печати на консоли, вы можете изменить окончательную кодировку на 'utf-8'

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...