UnicodeDecodeError: кодек «ascii» не может декодировать байт 0xe0 в позиции 0: порядковый номер не в диапазоне (128) - PullRequest
34 голосов
/ 21 ноября 2010

На одном из моих компьютеров появляется ошибка при работе с движком приложений Google или django.

Например:

  • app.yaml

    application: demas1252c
    version: 1
    runtime: python
    api_version: 1
    
    
    handlers:
       - url: /images
    static_dir: images
       - url: /css
    static_dir: css
       - url: /js
    static_dir: js
       - url: /.*
    script: demas1252c.py
    
  • demas1252c.py

    import cgi
    import wsgiref.handlers
    
    
    from google.appengine.ext.webapp import template
    from google.appengine.ext import webapp
    
    
    class MainPage(webapp.RequestHandler): 
    def get(self):
    values = {'id' : 10}
    
    
    self.response.out.write(template.render('foto.html', values))
    
    
    application = webapp.WSGIApplication([('/', MainPage)], debug = True)
    wsgiref.handlers.CGIHandler().run(application)
    
  • foto.html

    <!DOCTYPE html>
    <html lang="en">
        <head></head>
    <body>some</body>
    </html>
    

сообщение об ошибке:

C:\artefacts\dev\project>"c:\Program Files\Google\google_appengine\dev_appserver.py" foto-hosting
Traceback (most recent call last):
  File "c:\Program Files\Google\google_appengine\dev_appserver.py", line 69, in <module>
    run_file(__file__, globals())
  File "c:\Program Files\Google\google_appengine\dev_appserver.py", line 65, in run_file
    execfile(script_path, globals_)
  File "c:\Program Files\Google\google_appengine\google\appengine\tools\dev_appserver_main.py", line 92, in <module>
    from google.appengine.tools import dev_appserver
  File "c:\Program Files\Google\google_appengine\google\appengine\tools\dev_appserver.py", line 140, in <module>
    mimetypes.add_type(mime_type, '.' + ext)
  File "C:\Python27\lib\mimetypes.py", line 344, in add_type
    init()
  File "C:\Python27\lib\mimetypes.py", line 355, in init
    db.read_windows_registry()
  File "C:\Python27\lib\mimetypes.py", line 260, in read_windows_registry
    for ctype in enum_types(mimedb):
  File "C:\Python27\lib\mimetypes.py", line 250, in enum_types
    ctype = ctype.encode(default_encoding) # omit in 3.x!
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128)

Когда я работаю со статическими файлами в django (без gae), у меня очень похожая ошибка (с другим стеком).

Я попытался найти причину ошибки и добавил код в mimetypes.py:

.
print '====='
print ctype
ctype = ctype.encode(default_encoding) # omit in 3.x!

Затем я получаю следующие сообщения в моей консоли:

=====
video/x-ms-wvx
=====
video/x-msvideo
=====
рєфшю/AMR
Traceback (most recent call last):

В реестре HKCR / Mime / Database / ContentType / у меня есть пять ключей с русскими (кириллическими) буквами. Но как я могу исправить эту ошибку?

Ответы [ 5 ]

75 голосов
/ 21 ноября 2010

Это ошибка в mimetypes, вызванная неверными данными в реестре. (рєфшю/AMR вообще не является допустимым типом носителя MIME.)

ctype - это имя раздела реестра, возвращаемое _winreg.EnumKey, которое mimetypes ожидает, чтобы быть строкой Unicode, но это не так. В отличие от _winreg.QueryValueEx, EnumKey возвращает байтовую строку (прямо из ANSI-версии Windows API; _winreg в Python 2 не использует интерфейсы Unicode, даже если он возвращает строки Unicode, поэтому он никогда не будет читать не -АНСИ символы правильно).

Таким образом, попытка .encode завершится неудачно с Unicode Decode Ошибка при попытке получить строку Unicode перед кодированием обратно в ASCII!

try:
    ctype = ctype.encode(default_encoding) # omit in 3.x!
except UnicodeEncodeError:
    pass

Эти строки в mimetypes должны быть просто удалены.

ETA: добавлено в баг-трекер .

8 голосов
/ 24 мая 2013

Кстати, основной причиной проблемы является QuickTime, который добавляет типы MIME, не относящиеся к ascii, в реестр Windows.Самый простой способ исправить это - вручную найти и удалить из реестра подразделы HKCR/Mime/Database/ContentType/, начинающиеся с аудио/ и видео/.

5 голосов
/ 08 декабря 2013

Есть патч:

http://bugs.python.org/file18143/9291.patch

Отлично работает для меня.

Просто замените UnicodeEncodeError на UnicodeError

4 голосов
/ 11 февраля 2014

Альтернативное решение от python issue9291 от Александра Зарубкина (me21) :

добавить файл с именем sitecustomize.py в папку Lib \ site-packages.

import sys
sys.setdefaultencoding("cp1251")
1 голос
/ 14 сентября 2012

это ошибка Python с латинскими подсказками MIME в реестре, запускайте regedit и проверяйте "HKEY_CLASSES_ROOT \ MIME \ Database \ Content Type" на наличие нелатинских имен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...