Я использую модуль уценки от web2py для обработки размеченного текста. Проблема в том, что люди отправляют материалы со смарт-цитатами, специальными символами и т. Д., И мне нужно заменить их на их эквиваленты.
У меня есть такой текст: '\ n \ r \ nЛик полковника немного побледнел. \ xe2 \ x80 \ x9cНо, тогда \ xe2 \ x80 "извините за смелость, сэр \ xe2 \ x80" мы сейчас едем в Увар "
Как я могу гарантировать, что вызов unicode (txt, 'utf-8'), как это происходит с текстом внутри внутренней разметки, не вызовет ошибку? Причудливые специальные кавычки, которые вставляют программы обработки текста, являются обычной причиной, но, похоже, есть много символов, которые являются проблемой.