Как найти точность алгоритма кластеризации k-средних - PullRequest
0 голосов
/ 27 марта 2019

Я выполняю обучение без надзора по немеченым данным с использованием кластеризации k-средних. У меня нет обучающих данных, доступных со мной. Как измерить точность алгоритма? Как проверить полученные результаты?

1 Ответ

0 голосов
/ 27 марта 2019

Я хотел бы сказать вам, что нет точного количества кластеров, но есть несколько способов проверки.

Во-первых, вы можете использовать вычисление сходства между элементами в кластере, включая:

  • корреляция Пирсона
  • евклидово расстояние
  • или косинусная корреляция

Более того, среди кластеров вы можете видеть, что они действительно разделены илине используя:

  • Одиночная связь
  • Полная связь
  • или Средняя связь

Индекс Данна, Индекс Рэнда или Чистота такжехорошие кандидаты для оценки результатов кластеризации.

...