Я пытаюсь написать регулярное выражение, которое будет подсчитывать количество раз, когда два слова встречаются в определенной близости (в пределах 5 слов друг от друга) в строке, без двойного счета слов.
Например, если бы у меня была строка:
"Человеку понравилась его большая шляпа. Шляпа была очень большой."
В этом случае регулярное выражение должно видеть«большая шляпа» в первом предложении и «большие шляпы» во втором предложении, возвращая в общей сложности 2. Обратите внимание, что во втором предложении есть несколько слов между «шляпой» и «большой», они также появляютсяв порядке, отличном от первого предложения, но они все еще встречаются в окне из 5 слов.
Если регулярные выражения не являются правильным способом решения этой проблемы, пожалуйста, дайте мне знать, что я должен попробовать вместо этого.