Как применить кластеризацию на кластере? - PullRequest
0 голосов
/ 06 июня 2019

Я использовал R library(igraph) для создания кластеров в моем наборе данных.У меня есть несколько подключенных компонентов, но первый очень большой, это гигантский компонент.Я хотел бы повторно применить кластеризацию на этом гигантском компоненте, чтобы восстановить кластеры.Имеет ли смысл это делать?

Ответы [ 2 ]

0 голосов
/ 06 июня 2019

Что я имею в виду в своих комментариях, так это то, что я предполагаю, что у вас есть набор данных образцов (строк) и характеристик (столбцов).

Если, например, вы выполняете кластеризацию по K-среднему значению для всего набора данных и получаете результаты, о которых вы говорите, я бы создал новый набор данных, в который вы будете брать только те образцы, которые принадлежат большому кластеру. Таким образом, вы можете применить любой новый метод кластеризации к этому новому набору данных, и он должен разделиться больше.

Это потому, что в вашем исходном наборе данных, поскольку существуют большие относительные различия, различия внутри этого большого кластера не считаются важными (они намного меньше). Когда вы устраняете большие различия, можно найти и мелкие.

0 голосов
/ 06 июня 2019

По самой своей природе кластеризация не имеет никакого значения вне того, что люди решают ей дать.Если вы хотите разделить свой кластер на несколько кластеров, то вам нужно настроить гиперпараметры используемой модели.

Например, кластеризация K-средних позволяет вам априори выбрать количество кластеров, которое вы хотите иметь, в то время как подходы кластеризации на основе плотности обычно позволяют вам определить некоторую плотность значимости.Используемая вами библиотека выглядит не слишком подходящей для кластеризации, а скорее для вычислений на графике.

Я не слишком знаком с R, но вы можете попробовать clusterR пакет, как это, кажется, имеет много общих алгоритмов кластеризации.Я сам предпочитаю Python для таких вещей, в частности пакет под названием scikit-learn .

Надеюсь, это поможет!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...