Замена строки из встроенного неизвестного символа в Python - PullRequest
0 голосов
/ 18 апреля 2019

Я пытаюсь заменить этот нераспознанный текст ниже здесь другим текстом. Я расшифровал его до UTF-8 и попытался заменить неизвестный текст ниже.

"ты"

varlistlabela = spss.GetVariableLabel(var)
varlistlabela=varlistlabela.decode("cp1252").replace(r'[\u0020-\ud7ff]',"").encode("cp1252") 

1 Ответ

1 голос
/ 18 апреля 2019

Требуется подстановка регулярного выражения:

re.sub(r'[^\u0020-\ud7ff]', '', s)

, где s - строка ввода.

Код :

import re

s = " you�"
print(re.sub(r'[^\u0020-\ud7ff]', '', s))
#  you
...