Библиотека кластеризации на основе плотности, которая принимает матрицу расстояний в качестве входных данных - PullRequest
5 голосов
/ 12 сентября 2011

Требуется помощь в поиске открытой / свободной библиотеки кластеризации на основе плотности, которая принимает матрицу расстояний в качестве входных данных и возвращает кластеры с каждым элементом в пределах максимального расстояния "х" от каждого из других элементов в кластерах (в основном возвращая кластеры с указанная плотность).

Я проверил алгоритм DBSCAN, он, кажется, соответствует моим потребностям. Любые чистые реализации DBSCAN, которые вы могли бы не отключить, которые можно снять с помощью предварительно рассчитанной матрицы расстояний и кластеров вывода с требуемой плотностью?

Ваш вклад будет очень полезным.

Ответы [ 3 ]

1 голос
/ 25 ноября 2011

ELKI (в http://elki.dbs.ifi.lmu.de/) может загружать внешние матрицы расстояний, либо в двоичном формате, либо в формате Ascii, а затем запускать алгоритмы кластеризации на основе расстояний.

Однако некоторые алгоритмы, такие как k-means, не могут работать, так как они зависят от расстояния до / mean /, которое, очевидно, не вычисляется заранее. Но например DBSCAN и OPTICS прекрасно работают с предварительно вычисленными расстояниями.

0 голосов
/ 01 октября 2016

Обмен файлами в Matlab имеет реализацию , которую легко адаптировать к предварительно вычисленным матрицам. Просто удалите вызов pdist1 вне функции в вашем коде.

0 голосов
/ 14 февраля 2013

Я еще не пробовал, но я ищу что-то подобное и наткнулся на эту реализацию DBSCAN на Python:

http://scikit -learn.org / dev / auto_examples /кластер / plot_dbscan.html # пример-кластер сюжетно-dbscan-р

...