Удалить слово, если символ повторяется несколько раз - PullRequest
0 голосов
/ 18 февраля 2019

Я хочу удалить слово из предложения, если слово начинается с 4 или более повторяющихся символов.

eg: 
['aaaaaaa is really good', 'nott something great',
       'ssssssssssssstackoverflow is a great community']

Мне нужно вывести что-то вроде этого: например:

['is really good', 'nott something great', 'is a great community']

Я пробовал что-то вроде этого:

^(\S)\1{3,}

Он удаляет эти повторяющиеся символы, но не слово.Спасибо

1 Ответ

0 голосов
/ 18 февраля 2019

Добавить \S*\s в конец шаблона:

words = ['aaaaaaa is really good', 'nott something great','ssssssssssssstackoverflow is a great community']
newWords = [re.sub(r'^(\S)\1{3,}\S*\s', '', word) for word in words]

Вывод:

['is really good', 'nott something great', 'is a great community']

Если строка может состоять только из одного слова, то сделать последний пробелнеобязательно, \s? вместо \s.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...