Доступны неконтролируемые методы классификации - PullRequest
2 голосов
/ 18 ноября 2009

Я провожу исследование, которое включает «неконтролируемую классификацию». В основном у меня есть trainSet, и я хочу кластеризовать данные в количестве X классов без присмотра. Идея похожа на то, что делает k-means.

Допустим,

Шаг1) featureSet - это матрица [1057x10], и я хочу сгруппировать их в 88 кластеров.

Step2) Используйте ранее вычисленные классы, чтобы вычислить, как классифицируется testData

Вопрос -Можно ли это сделать с помощью SVM или N-N? Что-нибудь еще ? -Другие рекомендации?

Ответы [ 2 ]

2 голосов
/ 19 ноября 2009

Существует множество алгоритмов кластеризации, и в Интернете полно информации о них и примеров реализации. Хорошей отправной точкой является статья в Википедии о кластерном анализе Cluster_analysis .

Поскольку у вас есть работающая реализация k-means, вы можете попробовать один из множества вариантов, чтобы увидеть, дают ли они лучшие результаты (возможно, k-means ++, если вы упомянули SVM). Если вы хотите совершенно другой подход, взгляните на Kohonen Maps - также называемый Self Organizing Feature Maps. Если это выглядит слишком сложно, простую иерархическую кластеризацию легко реализовать (найти два ближайших элемента, объединить, промыть и повторить).

1 голос
/ 19 ноября 2009

Это звучит как классическая проблема кластеризации. Ни SVM, ни нейронные сети не смогут напрямую решить эту проблему. Вы можете использовать любой подход для уменьшения размерности , например, чтобы встроить ваши 10-мерные данные в двумерное пространство, но они не будут помещать данные в кластеры для вас.

Существует огромное количество алгоритмов кластеризации, кроме k-средних. Если вам нужен контрастный подход, вы можете попробовать алгоритм агломерационной кластеризации . Я не знаю, какую вычислительную среду вы используете, но мне очень нравятся R и это (очень) краткое руководство по кластеризации .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...