Сохранение содержимого текстового файла в БД: «Неверное значение строки:« \ xEF \ xBB \ xBF # W ... »для столбца« содержимое »в строке 1» - PullRequest
0 голосов
/ 19 мая 2011

В моем приложении Django я загружаю текстовый файл, используя file.read () для получения содержимого файла, а затем сохраняю в базу данных (используя метод Django .save ()).

Я получаю следующую ошибку:

Environment:

Request Method: POST
Request URL: http://localhost:8000/
Django Version: 1.2.5
Python Version: 2.7.1
Installed Applications:
['django.contrib.auth',
 'django.contrib.contenttypes',
 'django.contrib.sessions',
 'django.contrib.sites',
 'django.contrib.messages',
 'django.contrib.admin',
 'django.contrib.markup',
 'files']
Installed Middleware:
('django.middleware.common.CommonMiddleware',
 'django.contrib.sessions.middleware.SessionMiddleware',
 'django.middleware.csrf.CsrfViewMiddleware',
 'django.contrib.auth.middleware.AuthenticationMiddleware',
 'django.contrib.messages.middleware.MessageMiddleware')


Traceback:
File "/usr/lib/pymodules/python2.7/django/core/handlers/base.py" in get_response
  100.                     response = callback(request, *callback_args, **callback_kwargs)
File "/home/mcrittenden/Dropbox/Code/dropdo-django/dropdo/files/views.py" in index
  31.                 return handle_upload(request.FILES['file'])
File "/home/mcrittenden/Dropbox/Code/dropdo-django/dropdo/files/views.py" in handle_upload
  60.     file.save()
File "/usr/lib/pymodules/python2.7/django/db/models/base.py" in save
  458.         self.save_base(using=using, force_insert=force_insert, force_update=force_update)
File "/usr/lib/pymodules/python2.7/django/db/models/base.py" in save_base
  551.                     result = manager._insert(values, return_id=update_pk, using=using)
File "/usr/lib/pymodules/python2.7/django/db/models/manager.py" in _insert
  195.         return insert_query(self.model, values, **kwargs)
File "/usr/lib/pymodules/python2.7/django/db/models/query.py" in insert_query
  1524.     return query.get_compiler(using=using).execute_sql(return_id)
File "/usr/lib/pymodules/python2.7/django/db/models/sql/compiler.py" in execute_sql
  788.         cursor = super(SQLInsertCompiler, self).execute_sql(None)
File "/usr/lib/pymodules/python2.7/django/db/models/sql/compiler.py" in execute_sql
  732.         cursor.execute(sql, params)
File "/usr/lib/pymodules/python2.7/django/db/backends/util.py" in execute
  15.             return self.cursor.execute(sql, params)
File "/usr/lib/pymodules/python2.7/django/db/backends/mysql/base.py" in execute
  86.             return self.cursor.execute(query, args)
File "/usr/lib/pymodules/python2.7/MySQLdb/cursors.py" in execute
  168.         if not self._defer_warnings: self._warning_check()
File "/usr/lib/pymodules/python2.7/MySQLdb/cursors.py" in _warning_check
  82.                     warn(w[-1], self.Warning, 3)

Exception Type: Warning at /
Exception Value: Incorrect string value: '\xEF\xBB\xBF# W...' for column 'contents' at row 1

Я предполагаю (поскольку EF BB BF является символом UTF BOM), это связано с разницей в кодировке между БД и файлом?Это звучит правильно?Если да, то как мне это исправить?

Ответы [ 2 ]

2 голосов
/ 19 мая 2011

Вы на правильном пути. Проверьте кодировку вашей базы данных (это utf-8?). Если это не так и вы хотите использовать UTF-8, измените кодировку с помощью этой команды SQL

alter table yourTableName DEFAULT CHARACTER SET utf8;

И прочитайте этот замечательный учебник по использованию UTF-8 в Python, если вы хотите преобразовать строку UTF-8 обратно.

Вы можете удалить DOM с помощью этой команды

# Удалите спецификацию с начала строки Unicode, если она существует
u.lstrip (Unicode (codecs.BOM_UTF8, "utf8"))

0 голосов
/ 19 мая 2011

Вы правы, перед файлом, который вы читаете, вставлены символы спецификации. Вам придется проверить и удалить эти символы, прежде чем передавать данные. Остальная часть файла будет состоять из символов UTF-8.

Я не уверен, как определить, какой набор символов ожидает база данных.

...