Код c найти байтовую строку кодирования - PullRequest
0 голосов
/ 02 мая 2020

Есть ли какой-нибудь способ определить, какая кодировка используется в байтовой строке с кодеками в python. В chardet есть метод chardet.detect(string)['encoding'] Есть ли такой же метод в кодеках python

?

1 Ответ

0 голосов
/ 02 мая 2020

Нет встроенного метода, потому что было бы невозможно надежно определить это для произвольных значений и произвольных кодировок. (Например, любой текст, содержащий только символы ASCII, допустим в большинстве других кодировок.)

Лучшее, что вы можете сделать, - это серия блоков try-catch, в которых вы угадываете последовательность кодировок (например, UTF8, UTF16) и go до следующего, если есть недопустимый символ.

...