У меня есть большой набор файлов, которые были искажены преобразованием Python Requests в r.text.Первоначально это был UTF-8, но Requests предполагал ISO-8859-1, поэтому, например, e sharp расширился с hex C3A9
до C383C2A9
.Там куча таких.Есть ли способ исправить это с помощью Python?
Кстати, теперь я знаю, как установить кодировку перед записью в файл r.encoding = r.apparent_encoding
, но есть ли способ исправить это сейчас, не отслеживая каждый перевод?
Полагаю, что если я прочитаю как ISO-8859-1, у меня появятся два новых символа, которые не будут преобразованы обратно в один символ ETF-8, верно?