Найти подходящие фразы между двумя частями текста? - PullRequest
2 голосов
/ 21 декабря 2011

Моя цель - найти похожие фразы в двух частях текста.

Я знаю, что обычные слова будут проблемой.Например, and the we are the.В этом случае я думаю, что фильтр будет необходим.

Я хочу знать, был ли это хороший подход?При этом используется рекурсия, если он находит совпадение, он видит, является ли следующее слово также совпадением, и продолжается до тех пор, пока не будет найдено совпадение.

  1. the cat is on the roof
  2. a man is on the stage

  A1 = [the, cat, is, on, the, roof]
  A2 = [a, man, is, on, the, stage]

  [the]: no match
  [cat]: no match
  [is]: match
  [is, on]: match
  [is, on, the]: match
  [is, on, the, roof]: no match
  [on]: match
  [on, the]: match
  [on, the, roof]: no match
  [the]: match
  [the, roof]: no match
  [roof]: no match
  -end-

1 Ответ

3 голосов
/ 21 декабря 2011

Быстрый поиск в Google показал мне этот веб-сайт , содержащий решение вашей проблемы:

Он работает путем нахождения самой длинной последовательности слов, общих для обеих строк, и рекурсивнопоиск самых длинных последовательностей остатков строки, пока подстроки не будут иметь общих слов.На этом этапе он добавляет оставшиеся новые слова в качестве вставки и оставшиеся старые слова в качестве удаления.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...