Следующее регулярное выражение будет соответствовать любой повторяющейся последовательности символов:
/(.+).*?\1/
Если вам нужны только повторяющиеся последовательности, между которыми нет ничего, кроме пробела, используйте вместо этого:
/(.+)\s+?\1/
Если вы хотите, чтобы слова разделялись только пробелами, измените (.+)
на (\w+)
:
/(\w+)\s+?\1/
Если вы хотите посмотреть на слова, игнорируя такие вещи, как пунктуация, границы слов могут быть более полезными:
/(\b\w+?\b)\.+?\b\1\b/