Solr MoreLikeThis функция может помочь вам получить документы, похожие по содержанию.
Сходство основано на частых терминах, встречающихся в документе.
Коллекция запрашивает эти условия для получения аналогичных документов.
Если вы хотите группировать документы, вам понадобятся другие инструменты для кластеризации документов. Вы можете проверить Apache Mahout для кластеризации.
Это объединит документы в группы с использованием подхода TD / IDF.