Матрица смежности кластеров разных размеров - PullRequest
2 голосов
/ 06 декабря 2011

Я создал матрицу смежности для ориентированных графов разных размеров. У меня около 30 000 матриц, каждая в отдельном текстовом файле. Как их объединить, есть ли инструменты. Каков наилучший способ представления ориентированного графа для кластеризации.

Спасибо.

Ответы [ 3 ]

1 голос
/ 06 декабря 2011

Чего именно вы хотите достичь? Группировать похожие матрицы, верно? С K-означают, вы не будете иметь много удовольствия здесь. Матрицы смежности являются двоичными; интерпретировать их как огромные векторы и вычислять на них расстояние L-p-нормы (например, евклидово расстояние), а затем вычислять средние матрицы - то, что делает k-означает - мне не кажется разумным. Кроме того, вы, вероятно, будете укушены проклятием размерности . Большое количество измерений сделает все матрицы похожими.

Практически для любого алгоритма кластеризации первый вопрос вы в качестве «эксперта по области» должен будет ответить: что делает две матрицы смежности похожими? Как только вы формализовали это вы сможете запускать множество алгоритмов кластеризации, включая классическую кластеризацию с одним каналом, DBSCAN или OPTICS.

1 голос
/ 06 декабря 2011

Я бы попробовал k-средства и воронои-диаграммы.Это можно вычислить с помощью минимального связующего дерева и поиска самых длинных ребер.Затем вы можете вычислить другой кластер с помощью традиционных k-средних, используя ребра mst в качестве центра.Другой возможностью будет иерархический кластер, например, кривая заполнения пространства.См. Например: https://stats.stackexchange.com/questions/1475/visualization-software-for-clustering.

0 голосов
/ 06 декабря 2011

Вы можете найти некоторые идеи для графических функций / статистики здесь: http://networkx.lanl.gov/reference/algorithms.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...