Моя цель - найти похожие фразы в двух частях текста.
Я знаю, что обычные слова будут проблемой.Например, and the
we are the
.В этом случае я думаю, что фильтр будет необходим.
Я хочу знать, был ли это хороший подход?При этом используется рекурсия, если он находит совпадение, он видит, является ли следующее слово также совпадением, и продолжается до тех пор, пока не будет найдено совпадение.
1. the cat is on the roof
2. a man is on the stage
A1 = [the, cat, is, on, the, roof]
A2 = [a, man, is, on, the, stage]
[the]: no match
[cat]: no match
[is]: match
[is, on]: match
[is, on, the]: match
[is, on, the, roof]: no match
[on]: match
[on, the]: match
[on, the, roof]: no match
[the]: match
[the, roof]: no match
[roof]: no match
-end-