Question

Я использовал R library(igraph) для создания кластеров в моем наборе данных.У меня есть несколько подключенных компонентов, но первый очень большой, это гигантский компонент.Я хотел бы повторно применить кластеризацию на этом гигантском компоненте, чтобы восстановить кластеры.Имеет ли смысл это делать?

boski · Answer 1 · 06 июня 2019

Что я имею в виду в своих комментариях, так это то, что я предполагаю, что у вас есть набор данных образцов (строк) и характеристик (столбцов).

Если, например, вы выполняете кластеризацию по K-среднему значению для всего набора данных и получаете результаты, о которых вы говорите, я бы создал новый набор данных, в который вы будете брать только те образцы, которые принадлежат большому кластеру. Таким образом, вы можете применить любой новый метод кластеризации к этому новому набору данных, и он должен разделиться больше.

Это потому, что в вашем исходном наборе данных, поскольку существуют большие относительные различия, различия внутри этого большого кластера не считаются важными (они намного меньше). Когда вы устраняете большие различия, можно найти и мелкие.

HowdyEarth · Answer 2 · 06 июня 2019

По самой своей природе кластеризация не имеет никакого значения вне того, что люди решают ей дать.Если вы хотите разделить свой кластер на несколько кластеров, то вам нужно настроить гиперпараметры используемой модели.

Например, кластеризация K-средних позволяет вам априори выбрать количество кластеров, которое вы хотите иметь, в то время как подходы кластеризации на основе плотности обычно позволяют вам определить некоторую плотность значимости.Используемая вами библиотека выглядит не слишком подходящей для кластеризации, а скорее для вычислений на графике.

Я не слишком знаком с R, но вы можете попробовать clusterR пакет, как это, кажется, имеет много общих алгоритмов кластеризации.Я сам предпочитаю Python для таких вещей, в частности пакет под названием scikit-learn .

Надеюсь, это поможет!

Как применить кластеризацию на кластере?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как применить кластеризацию на кластере?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы