Для машинного обучения я должен «очистить» некоторый текст, который я извлекаю, поэтому я попробовал это:
texto = "sdf sdf s _ sfsf sdfs _________ sfsdf"
texto = texto.replace(r"_{2,}"," ")
print(texto)
Но результат не был ожидаемым:
sdf sdf s _ sfsf sdfs _________ sfsdf
Хотелось бы:
sdf sdf s _ sfsf sdfs sfsdf