Я работаю над функциональностью kmeans для универа. Нам нужно запустить евклидову кластеризацию на одном наборе данных, а затем Jaccard на другом. Нам нужно изучить несколько разных моделей для оценки количества кластеров, и для евклидова было довольно просто использовать sklearn.metrics.silhouette_score , но это не дает возможности использовать расстояние по Джакарду.
Поэтому мне было интересно, есть ли у кого-нибудь идея, как рассчитать его для расстояния Жакара? Мне удалось создать матрицу для всех расстояний друг от друга. Я также использовал метод Локоть на евклидовом расстоянии, будет ли это правильным методом и для Жакара?