На английском языке, иногда у вас есть повторяющиеся буквы вроде этого:
hello my hero hhhhhhhhhhh
это для h
, но я хочу удалить все виды букв, повторяющихся как это 2 или более раз, и заменить их пробелом в юникодной букве. У меня здесь арабский язык. У меня есть только одно письмо, которое я могу удалить, это мой код:
#remove laughing
def remove_laughs(self, text):
text=re.sub("ه{2,}", "", text)
return text