Наборы данных для кластеризации минимального связующего дерева - PullRequest
0 голосов
/ 12 июня 2018

Недавно я столкнулся с идеей минимального связующего дерева и обнаружил, что у него есть приложение для кластеризации.Я ищу реальный набор данных (желательно чистый), который можно использовать в качестве источника данных для различных алгоритмов кластеризации.Есть информация, что кластеризация MST достаточно хорошо работает на сферических и несферических данных.Вот почему также ищутся несферические наборы данных.

Наборы данных, которые я имею в виду, должны содержать основную информацию об истинности (метки), чтобы эффективность различных алгоритмов могла быть измерена чем-то отличным от WSS.

1 Ответ

0 голосов
/ 12 июня 2018

Минимальная кластеризация связующего дерева является стандартной и хорошо изученной.

Это просто называется по-разному.

Однолинейная иерархическая кластеризация - это как минимум минимальное связующее дерево, иАлгоритм быстрого SLINK тесно связан с алгоритмом Прима.

Слабые стороны также хорошо понятны.И вы можете использовать практически любой набор данных.Например, общий набор данных Iris.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...