Question

Есть ли какой-нибудь способ определить, какая кодировка используется в байтовой строке с кодеками в python. В chardet есть метод chardet.detect(string)['encoding'] Есть ли такой же метод в кодеках python

?

Christoph Burschka · Answer 1 · 02 мая 2020

Нет встроенного метода, потому что было бы невозможно надежно определить это для произвольных значений и произвольных кодировок. (Например, любой текст, содержащий только символы ASCII, допустим в большинстве других кодировок.)

Лучшее, что вы можете сделать, - это серия блоков try-catch, в которых вы угадываете последовательность кодировок (например, UTF8, UTF16) и go до следующего, если есть недопустимый символ.

Код c найти байтовую строку кодирования

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Код c найти байтовую строку кодирования

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы