Как я могу удалить несколько последовательных вхождений всех специальных символов в строке?
Я могу получить код типа
re.sub('\.\.+',' ',string)
re.sub('@@+',' ',string)
re.sub('\s\s+',' ',string)
для отдельных лиц и в В лучшем случае используйте al oop для всех символов в списке, например
from string import punctuation
for i in punctuation:
to = ('\\'+i+'\\'+i+'+')
string = re.sub(to,' ',string)
, но я уверен, что есть и эффективный метод.
Я пробовал
re.sub('[^a-zA-Z0-9][^a-zA-Z0-9]+',' ','\n\n.AAA.x.@@+*@#=..xx000..x..\t.x..\nx*+Y.')
но он удаляет все специальные символы, кроме одного, перед которым стоят алфавиты.
строка может иметь различные последовательные специальные символы, такие как 99@aaaa*!@#$.
, но не такие, как ++--...