Сравните результаты кластера k-средних с иерархической кластеризацией - PullRequest
0 голосов
/ 20 января 2019

У меня есть набор данных (числовой), и я создал алгоритм k-средних для создания кластеров на основе характеристик. Для K-средних, поскольку мы назначаем количество кластеров, я хотел попробовать другой метод и сравнить результаты с k-средними. Для этого я написал кусок кода об агломерационной иерархической кластеризации. Глядя на мои графики и кластеры невооруженным глазом, k-средние и агломерационные графики выглядят одинаково. Но это не помогает статистически сказать, есть ли какая-либо разница. Может кто-нибудь пролить свет на то, как мы можем сравнить 2 алгоритма?

Надеюсь, это не расплывчато, пожалуйста, дайте мне знать, если вам нужны какие-то конкретные детали для этого. Я буду рад опубликовать это. В этот момент я застрял в самой концепции и хотел поставить вопрос только об этом.

1 Ответ

0 голосов
/ 03 февраля 2019

Вы можете сравнить обе эти программы по времени выполнения и использованию памяти. При выполнении с разными наборами данных результаты могут отличаться. Определенно К-значит будет лучше, чем другие.

...