Question

Моя цель - найти похожие фразы в двух частях текста.

Я знаю, что обычные слова будут проблемой.Например, and the we are the.В этом случае я думаю, что фильтр будет необходим.

Я хочу знать, был ли это хороший подход?При этом используется рекурсия, если он находит совпадение, он видит, является ли следующее слово также совпадением, и продолжается до тех пор, пока не будет найдено совпадение.

  1. the cat is on the roof
  2. a man is on the stage

  A1 = [the, cat, is, on, the, roof]
  A2 = [a, man, is, on, the, stage]

  [the]: no match
  [cat]: no match
  [is]: match
  [is, on]: match
  [is, on, the]: match
  [is, on, the, roof]: no match
  [on]: match
  [on, the]: match
  [on, the, roof]: no match
  [the]: match
  [the, roof]: no match
  [roof]: no match
  -end-

Geert · Answer 1 · 21 декабря 2011

Быстрый поиск в Google показал мне этот веб-сайт , содержащий решение вашей проблемы:

Он работает путем нахождения самой длинной последовательности слов, общих для обеих строк, и рекурсивнопоиск самых длинных последовательностей остатков строки, пока подстроки не будут иметь общих слов.На этом этапе он добавляет оставшиеся новые слова в качестве вставки и оставшиеся старые слова в качестве удаления.

Найти подходящие фразы между двумя частями текста?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Найти подходящие фразы между двумя частями текста?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов