Я делаю некоторые задачи по НЛП. Итак, мне нужно определить несколько удлинений и одно удлинение в тексте.
Пример одинарного удлинения: simpleeeeeeeeeee
Пример нескольких удлинений: Goooooodd dddddd
Мне удалось использовать следующий код для определения удлинения в тексте.
def find_total_elongations(str):
regex = re.compile(r"(.)\1{2}")
list = [word for word in str.split() if regex.search(word)]
return len(list)
Пример ввода: Whyyyyyyyy arrrrrreeeeee youuuuuuuu sooooooooooo serrrrrrrrrrriiiiiiious?
Пример выходных данных:
Одиночное удлинение: ["Whyyyyyyyy", "youuuuuuuu", "sooooooooooo"]
Множественное удлинение: ["arrrrrreeeeee" , "serrrrrrrrrriiiiiiious"]
Как я могу изменить приведенный выше код для определения множественного удлинения и одиночного удлинения отдельно?