Если вы пытаетесь конвертировать из str
у вас в unicode
, вы хотите использовать html.decode
, а не encode
.
Старый, плохой совет: Кроме того, поскольку у вас там, похоже, есть спецификация в начале, вы, вероятно, захотите использовать 'utf_8_sig'
в качестве кодировки, что приведет к удалению спецификации при декодировании..
Новый, лучший совет: На самом деле, при просмотре всех этих \x00
в выходных данных вместе с спецификацией, похоже, что кодировка на самом деле является UTF-16, а неUTF-8.Так что, html.decode('utf-16')
должен быть путь.