Question

Я хочу сохранить некоторый текст в базе данных, используя оболочки Django ORM. Проблема в том, что этот текст создается путем очистки внешних веб-сайтов, и часто кажется, что они перечислены с неправильной кодировкой. Я хотел бы сохранить необработанные байты, чтобы улучшить обнаружение кодирования с течением времени без повторной обработки. Но Django, кажется, хочет, чтобы все было сохранено как Unicode. Можно ли как-нибудь обойти это?

S.Lott · Answer 1 · 07 апреля 2009

Создать файл с данными. Используйте Django models.FileField для хранения ссылки на файл.

Нет, это не требует тонны ввода / вывода. Если ваш файл небольшой, он добавляет 2 или 3 ввода / вывода (чтение каталога, чтение iNode и чтение данных).

Alexander Artemenko · Answer 2 · 07 апреля 2009

Вы можете хранить данные, например, закодированные в base64. Или попробуйте проанализировать HTTP-заголовки из браузера, может быть, проще получить правильную кодировку оттуда.

Как обрабатывать Unicode неизвестной кодировки в Django?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как обрабатывать Unicode неизвестной кодировки в Django?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов