Удалить неизвестный спецсимвол - PullRequest
0 голосов
/ 18 января 2019

Удалить специальный символ

 s="____Ç_apple___   _______new A_____"

 print(re.sub('[^0-9a-zA-Z]\s+$', '', s))

результат = ____ Ç _______________ apple___ _______ новый A _____

 s="____Ç_apple___   _______new A_____"

 print(re.sub('[^0-9a-zA-Z]', '', s))

результат = applenewA

окончательный результат = яблоко новое A

но я не могу получить

я хочу удалить Ç и _ и сохранить пробел и английский

Ответы [ 2 ]

0 голосов
/ 18 января 2019

Вы хотите 'яблочный новый A' для результата, верно?

s="____Ç_apple___   _______new A_____"

result = re.sub('[^a-zA-Z|\s]+', '', s)  # apple   new A
result = ' '.join(result.split())  # apple new A
print(result)
0 голосов
/ 18 января 2019

Поскольку вы хотите объединить несколько пробелов в один пробел, а затем удалить символы, которые не являются словами или пробелами, вы должны сделать это в двух отдельных подстановках регулярного выражения:

print(re.sub(r'[^0-9a-zA-Z ]+', '', re.sub(r'\s+', ' ', s)))

Это приводит к выводу:

apple new A
...