У меня есть файлы, которые неправильно запрограммирована в функции Python Requests, расширяя специальные символы - PullRequest
0 голосов
/ 18 мая 2019

У меня есть большой набор файлов, которые были искажены преобразованием Python Requests в r.text.Первоначально это был UTF-8, но Requests предполагал ISO-8859-1, поэтому, например, e sharp расширился с hex C3A9 до C383C2A9.Там куча таких.Есть ли способ исправить это с помощью Python?
Кстати, теперь я знаю, как установить кодировку перед записью в файл r.encoding = r.apparent_encoding, но есть ли способ исправить это сейчас, не отслеживая каждый перевод?

Полагаю, что если я прочитаю как ISO-8859-1, у меня появятся два новых символа, которые не будут преобразованы обратно в один символ ETF-8, верно?

...