Question

У меня есть большой набор файлов, которые были искажены преобразованием Python Requests в r.text.Первоначально это был UTF-8, но Requests предполагал ISO-8859-1, поэтому, например, e sharp расширился с hex C3A9 до C383C2A9.Там куча таких.Есть ли способ исправить это с помощью Python?
Кстати, теперь я знаю, как установить кодировку перед записью в файл r.encoding = r.apparent_encoding, но есть ли способ исправить это сейчас, не отслеживая каждый перевод?

Полагаю, что если я прочитаю как ISO-8859-1, у меня появятся два новых символа, которые не будут преобразованы обратно в один символ ETF-8, верно?

У меня есть файлы, которые неправильно запрограммирована в функции Python Requests, расширяя специальные символы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

У меня есть файлы, которые неправильно запрограммирована в функции Python Requests, расширяя специальные символы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы