Сравнение результатов кластеризации из 2 разных наборов данных - PullRequest
0 голосов
/ 03 августа 2020

Итак, я пытаюсь выяснить, насколько похожи 2 результата кластеризации (hirarchial). 1-й набор данных состоит из 10 объектов. 2-й набор данных включает эти 10 функций плюс 5 дополнительных функций. Итак, моя основная c идея состоит в том, чтобы проверить гипотезу, если после добавления новых функций в 1-й набор данных кластеры значительно различаются или нет. Я не могу найти, как это сделать. Я читал несколько сообщений об индексах / показателях Rand, но им нужны метки наземной достоверности, которых у меня нет. В других сообщениях предлагаются встроенные c метрики кластеризации, такие как DB index / Silhoutte, но они предназначены для поиска оптимального количества кластеров и не относятся к моему конкретному случаю c.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...