У меня есть эти ActiveRecords
items = [{title: "Title 1"}, {title: "Title 2"}, {title: "Title 3"}]
Теперь я хочу сгруппировать элементы с похожим названием (используя функцию расстояния Левенштейна> 70%).
Я думал что-то вроде item.group_by{}
но мне интересно, как рассчитать счет для каждой комбинации? Я должен сравнить title1 с title3 и title2 с title3 et c ..
def levenshtein_distance(title_a, title_b)
...
return score
end
Я пытался использовать алгоритм кластеризации (KMedoids с неевклидовым метри c), но я не знаю размер кластера (k) a-priori.