При выдаче одного и того же запроса с запросом на совпадение (*: *) я получаю разные кластеры и оценки все время. В чем может быть причина?
Первая попытка:
label: "В Минске"
score: 52.79549568196028
Вторая попытка:
label: "В Минске"
"score": 54.74385944060893
Третья попытка:
label: "В Минске"
"score": 48.884082925408734
Идентификаторы документов внутри кластеров также различны. Сами кластеры меняются: в одном ответе на запрос я получаю кластер «тысячами евро», в последующем он исчезает, но появляется новый кластер: «Тысячами Долларов»
Есть ли какой-нибудь морковный параметр, который мог бы сделать кластеры стабильными для данного запроса? Может ли быть желаемым ClusterCountBase?
Индекс Solr одинаков для всех случаев. Используемый алгоритм: org.carrot2.clustering.lingo.LingoClusteringAlgorithm с StopWordLabelFilter.enabled = false и clustering.rows = 1000.