Во-первых, вы можете уменьшить все повторы более чем на две буквы. Я почти уверен, что нет английских слов с любыми 3 последовательными повторениями.
Это уменьшает:
ханггрррый к ханггррый
от awweeeeseom до удивительного
Расстроенный в расстроенный (без изменений)
loooooove, чтобы любить
Тогда вы, вероятно, добьетесь большего успеха с традиционными подходами к проверке орфографии.
Поскольку вы знаете, что ищете дубликаты, вы также можете сгенерировать все варианты, превратив дубликаты в отдельные буквы:
Hunggrryy -> Hungrryy, голодный, голодный и т. Д.
и посмотрите, соответствует ли один из них поиску в словаре. Обратите внимание, что вы можете получить ложные срабатывания для подобных слов, как потерять, потерять; сын, скоро