Python Кодировать Ã3 как ó - PullRequest
0 голосов
/ 27 мая 2020

У меня есть строка вроде

' La empresa de capitales mixtos que opera el predio de резюмирует, Ceamse, aclarÃ3 este martes que la responsabilidad del desentendimiento con los recicladores informales que provocÃ3 un nuevo bloqueo y hace peligrar la recolecciÃ3n '

и вам это нужно

' La empresa de capitales mixtos que opera el predio de restuos, Ceamse , aclaró este martes que la responsabilidad del desentendimiento con los recicladores informales que provocó un nuevo bloqueo y hace peligrar la recolección '

как я могу сделать это с Python?

спасибо!

1 Ответ

1 голос
/ 27 мая 2020

Вам необходимо исправить ваш веб-скрипт!

Похоже, La Capital отправляет правильный HTTP-заголовок и html заголовочную информацию, а содержимое закодировано в UTF-8. Итак, ваш сценарий должен справиться с этим, и все будет работать нормально.

Я знаю по опыту, что request.get и beautifulsoup 4 хорошо справляются с Unicode, поэтому просто отладьте свой сценарий и посмотрите, где он пойдет не так. Проверьте исходный ввод, проверьте, нужен ли вам файл .content или .text вашей страницы, и исправьте его соответствующим образом.

...