Как обрабатывать Unicode неизвестной кодировки в Django? - PullRequest
1 голос
/ 07 апреля 2009

Я хочу сохранить некоторый текст в базе данных, используя оболочки Django ORM. Проблема в том, что этот текст создается путем очистки внешних веб-сайтов, и часто кажется, что они перечислены с неправильной кодировкой. Я хотел бы сохранить необработанные байты, чтобы улучшить обнаружение кодирования с течением времени без повторной обработки. Но Django, кажется, хочет, чтобы все было сохранено как Unicode. Можно ли как-нибудь обойти это?

Ответы [ 2 ]

1 голос
/ 07 апреля 2009

Создать файл с данными. Используйте Django models.FileField для хранения ссылки на файл.

Нет, это не требует тонны ввода / вывода. Если ваш файл небольшой, он добавляет 2 или 3 ввода / вывода (чтение каталога, чтение iNode и чтение данных).

1 голос
/ 07 апреля 2009

Вы можете хранить данные, например, закодированные в base64. Или попробуйте проанализировать HTTP-заголовки из браузера, может быть, проще получить правильную кодировку оттуда.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...