Сходство документов, как в контексте текстового поиска ? Тогда Solr будет отвечать всем требованиям. Это корпоративная поисковая платформа с открытым исходным кодом, обладающая всеми функциями, необходимыми для текстового поиска, включая «, более похожий на этот », который может извлекать n документов, похожих по тексту.
Пара соответствующих функций, которые могут вас заинтересовать:
- его можно легко развернуть в виде веб-приложения Java на Tomcat, если установка Hadoop вас пугает.
- аспекты и числовые сравнения, которые могут увеличить текстовые сравнения.