Question

У меня есть два файла (f1 и f2), содержащие текст (или двоичные данные).
Как я могу быстро найти общие блоки?

, например
f1: ABC DEF
f2: XXABC XEF

выход:

общие блоки:
длина 4: «ABC» в f1 @ 0 и f2 @ 2 длина 2: «EF» в f1 @ 5 и f2 @ 8

torial · Answer 1 · 23 сентября 2008

Это отличный инструмент для таких целей. http://sourceforge.net/projects/duplo/

David Medinets · Answer 2 · 23 сентября 2008

Проект PMD с открытым исходным кодом имеет модуль детектора вырезания и вставки, который упоминается на этой странице: http://pmd.sourceforge.net/integrations.html.

Torsten Marek · Answer 3 · 23 сентября 2008

В Википедии есть некоторый псевдокод для поиска самой длинной общей подстроки между двумя последовательностями данных. В вашем случае вы просто извлекаете из таблицы все общие подстроки, которые не являются префиксами других общих подстрок (т.е. максимальных общих подстрок).

Нахождение общих блоков

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нахождение общих блоков

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов