Эта страница (LingPipe) дает несколько советов о сравнении строк. Это говорит о расстоянии Дамерау-Левенштейна, алгоритме Нидлмана-Вунша, расстоянии Жакара, расстоянии Яро-Винклера, расстоянии TF / IDF. Расстояние понимается как сходство между двумя строками.
В конце страницы приводятся ссылки, а также готовая к использованию реализация Java ( загрузка и лицензия )