Недавно я столкнулся с идеей минимального связующего дерева и обнаружил, что у него есть приложение для кластеризации.Я ищу реальный набор данных (желательно чистый), который можно использовать в качестве источника данных для различных алгоритмов кластеризации.Есть информация, что кластеризация MST достаточно хорошо работает на сферических и несферических данных.Вот почему также ищутся несферические наборы данных.
Наборы данных, которые я имею в виду, должны содержать основную информацию об истинности (метки), чтобы эффективность различных алгоритмов могла быть измерена чем-то отличным от WSS.