Я пытаюсь предварительно обработать некоторые твиты для проекта ML, где у меня возникают проблемы с двумя типами строк, например
str1 = "coooool"
и str2 = "gooooaaaaaal"
. После удаления повторяющихся символов я хотел бы сохранить слово в str1, то есть
cleaned_str1 = "cool"
, а cleaned_str2 = "goal"
.
Я попробовал несколько подходов, которые нашел, но не смог получить правильный вывод. Может ли кто-нибудь помочь мне с этим? Заранее спасибо.