Невидимые символы в UTF-8 - PullRequest
       26

Невидимые символы в UTF-8

0 голосов
/ 07 сентября 2018

У меня следующая проблема: у меня есть много XML-файлов во многих поддоменах, которые содержат невидимые символы (для UTF-8), например "\ xad", "xc2", "xe2", "\ x80" , "\ x91" и т. д.

Все эти символы должны быть удалены из XML. Есть ли какая-нибудь хорошая функция в Python, или как бы вы это сделали? (И как бы вы рассмотрели все XML-файлы во всех поддоменах? Это не возможно сделать вручную ...)

Спасибо за любые подсказки!

...